数文会“企”示录|影眸科技:AI生成数字替身要多久?30秒!
大众报业·风口财经 2023-04-07

f5fc4bba-213742.png

风口财经记者 王好

  生成式AI,2023青岛数字文化应用产品交易大会(以下简称“数文会”)上的绝对焦点之一。

  它能干什么?普通人能用吗?AI生成一张图片需要多久?在参展商影眸科技(上海)有限公司展区,业内外观展人士络绎不绝,上海科技大学智能视觉与数据中心研究生,Z世代创业者,影眸科技(上海)有限公司CTO张启煊不断的回答着这些观展者抛出的“高频问题”。吸引大家驻足热聊的是4月1日刚刚上线、此次数文会上首次公开展示的全球首个Production-Ready Text to 3D产品ChatAvatar。

  “ChatAvatar使用我们自主研发的生成式AI技术,你只需要跟AI助手去描述一下想要生成一个怎样的角色,它就能根据你的描述快速生成一个3D头像,应用场景包括影视和游戏作品等领域。”张启煊告诉记者,以游戏为例,如果游戏公司接入这套系统,以前大家要得到像这样的高精度数字形象,可能需要重型扫描系统,而现在,只需要上传一张照片,或者语音文字来指挥AI助手就可以完成,人人都可以更方便的获取自己的数字替身。

  那么,ChatAvatar生成一个数字替身,有多快呢?只需要大概30秒。

  据介绍,传统方式下,这项工作由模型师完成,而创造一个三维图像并非易事。首先是入行门槛高,学习雕刻技艺,并且熟练掌握,大概需要几个月甚至几年的时间。此外,传统雕刻制作周期长,从几周到几个月时间不等。而如今,生成式AI技术不仅让制作周期光速式缩短,更让整个创作过程大大简化,普通人也能上手。

  “女性,20岁-30岁之间,性格外向开朗。”

  “好的,这位女性角色的年龄在20岁到30岁之间,性格外向开朗。请问她的职业是什么呢?还有她有哪些明显的特点或者和哪些名人相似呢?”

  “她是一位歌手,有着非常好听的嗓音。”

  “明白了,这位女性角色是一位歌手,有着非常好听的嗓音。如果要形容她的特点,可以说她是充满活力和自信的年轻女性,同时也非常具有才华和魅力。如果要和某个名人相似的话,可以说她有点像韩国女歌手IU,不知道您是否同意呢?”

  ......

  记者在现场看到,不少普通人通过对话框跟AI助手进行创作描述,而从对话中可以发现,AI助手不只是简单执行,而是可以跟创作者互动,让最终的图像更符合用户心中的想法。更神奇的是,生成的3D人物头像可以说精细到毛孔,几乎与普通人的皮肤状态无异,并且面部光影也会随着角度的变化而呈现自然变化,生动逼真。

  张启煊告诉记者,相比Google、NVIDIA等大厂推出的同类竞品,ChatAvatar系统的核心技术和竞争力在于生成的角色质量上,精度更高,输入自然语言文本即可生成符合CG行业制作标准的3D人脸模型与PBR材质。这意味着,可以直接使用到游戏和影视作品中,实现时间与成本上的飞跃。

  现场,除了对普通用户开放的ChatAvatar,影眸科技还展示了服务专业影视行业用户的另一“杀手锏”——穹顶光场。

  据介绍,穹顶光场是世界唯二、亚洲唯一的微米级面部扫描系统,可以以超高速度和精度动态扫描面部材质、捕捉表情变化的肌肉运动,实现对人脸面部表情的高精度数据采集;高精度数字人脸模型生成系统将人工智能、计算摄影学、图形学等技术相结合,可以基于扫描得到的数据全流程自动化输出高精度可驱动的超写实数字人脸模型,整套流程可以在3天内生成好莱坞级别的数字人动态与静态资产。

  据了解,穹顶光场对于其扫描的真人,能够记录下面部在不同光线下反射状况,并通过这些信息,运用算法解析皮肤材质,从而为ChatAvatar提供数据积累,进而形成AI生成的生态闭环。

  事实上,作为一家2020年成立的初创企业,孵化于上海科技大学的影眸科技正在通过与国内顶尖人工智能、计算机视觉实验室合作,推动尖端实验室科研成果商业化,探索前沿人工智能、计算机视觉技术在文娱市场的落地应用,而青岛正在成为这支年轻团队的“主战场”。

  “穹顶光场刚刚入驻东方影都5号棚,这也是该系统跟国内影视基地的首次合作。”据介绍,东方影都5号棚的影视虚拟化制作平台,是国内功能最全的数字化虚拟摄影棚,设施规模在整个亚洲也无出其右者。张启煊表示,未来影眸科技将跟东方影都联合运营,为影视基地内的电影拍摄提供高质量的数字角色。

编辑:张亭旺