4、多录录:虚拟微电影创作平台

多录录是北京多魔钛科技于 2022 年 3 月面向国内用户推出的虚拟内容创作平台。用户可以借助多录录创作出有动作、有表情、有声音、有背景的虚拟数字人微电影。目前目前仍处于“单机”状态,尚未提供社交或社区服务。

image.gif

创建Avatar·储备演员

与其他虚拟创作平台类似,用户在多录录上的第一件事是创建虚拟形象。只不过用户在多录录上创建的并不是自己的虚拟化身,而是“演员”,鉴于用户在多录录上的主要使用场景,用户在多录录上的身份既是导演、又是编剧,还是演员。

多录录为用户提供了 2 个可自定义虚拟形象,以及 22 个系统预设形象。在系统预设形象中,不同的人物有不同的姓名、风格、爱好、性别和形象。

image.gif

而在自定义形象侧,多录录提供了“月鹿”和“余火”两个基础形象,用户可以根据自己的需求为演员选择不同的服装和妆容。

整体来看,素材的颜色个性化选择丰富,几乎所有的妆容都可以自定义调整颜色。尽管如此,仍难掩整个 Avatar 创建过程的朴素,在服装和身材上几乎没有留出可修改余地。

目前用户最多可创建 6 位演员,当演员人数达到上限时,需要删除不需要的演员才能创建新演员,而多录录在这部分提示时所使用的措辞为“您当前最多可拥有 6 位演员”,为后续商业化变现提前埋下伏笔,用户或可通过开通会员或购买权益增加可持有的演员数量。

Avatar+表演+场景·简易微电影

尽管仍处于非常早期的状态,但多录录在内容创作上确实有一些自己的设计。我们从场景和角色2部分来对多录录在内容创作上的设计进行拆解。

(1)背景

多录录为用户提供 3D 场景和影棚两种场景。

image.gif

在影棚中,提供彩色背景、演播室、奇妙空间、知名地标、城市街道、生活场所、自然风光、交通工具、暗黑惊悚地点等 7 种不同类别的 82 个背景选择,种类丰富。尽管背景仅为静态照片,但从角色在不同照片背景中都有较高的适配度来看,应该是经过精挑细选的结果。

在背景处,用户除了可以调整背景的大小和比例,还可以自由调整角色的大小、位置以及朝向。

在 3D 背景中,目前多录录设计了“南屿月夜”、“南屿晴空”、“小镇樱园”、“小镇街角”等 4 个不同的3D 场景。在静态影棚中的大小和方向调整之外,在 3D 场景中用户还可以以不同的姿势移动,如走路、慢跑、欢快跑、悠闲地走等。而且除了简单的位移,用户可以通过切换场景地图直接将角色移动到目标区域,在一些场景中,用户还可以与桌椅等场景互动。

虽然场景的精细度仍有较大的可进步空间,但客观来讲场景很唯美、丰富,很有浪漫的氛围。

(2)角色

在同一场景中,用户可以选择 1-2 “演员”饰演角色。在创建内容时,用户可以自由设定角色的动作和台词。

·动作

多录录将动作分为姿态、情绪、日常和舞蹈 4 大类别,并针对角色性别的不同设计了不同的动作。除了基础的站、卧、坐、走。多录录的很多动作更具代入感和丰富性。

image.gif

在情绪类别中,男生动作为扶栏张望、喝水、讲两句、激烈争辩、无辜、推脱、平静等具备男性日常特征的动作;女生动作为生气、讲解、开心、平静、推脱。甚至相同的动作命名,在男女肢体表达中也有不同的呈现。这一点多录录不说百分百还原,也确实有认真尝试。

除了选择系统预设动作,用户还可以选择上传照片来自创动作。系统会根据用户上传的单人全身正面照,用 AI 帮助角色生成照片同款动作。根据笔者体验来看,识别转化速度还不错,但动作正确率有待进一步增强。

·台词

多录录将台词分为“面捕配音”和“文本转语音”两种类别。

image.gif

在面捕配音时,系统会自动捕捉记录用户的表情神态和声音。声音几乎可以做到完全还原,而表情,在眼部以及头部动作的识别准确率较高,但在唇部嘟嘴、伸舌头等动作则表现一般。不过整体来看,准确率和面捕转化速度超出预期。

而在文本转语音时,用户需要预先在文本框中以文字的形式输入台词,在选定音色、情绪、语速、音调等声音设置后,系统会将文本自动生成语音台词。目前多录录,提供元气女声、娇憨女生、阳光男声、播报男声、活泼男童、软萌女童等 6 种不同的声音。客观来说,声音常见于广播剧、听书等场景,辨识度不高、倒也还算可接受。

动态捕捉+Avatar 的组合在虚拟平台中并不少见,但多录录似乎在常规方式中找到了与自身平台相契合的特质。

尽管目前多录录的工具属性远强于社交和社区属性,但鉴于其提供的服务,后面转型成类似 IMVU 的虚拟社交社区应该问题不大。客观来说,多录录仍有不少可完善的细节,不过其在多录录创建的尝试或许会为我们探索虚拟平台提供一个有趣的视角。