作为构建未来虚拟世界诸多应用的主干,如何创造栩栩如生的虚拟数字人,一直是计算机视觉、计算机图形学与多媒体等人工智能相关学科密切关注的重要研究课题。近日,中国科学技术大学联合的卢深视科技有限公司、浙江大学与清华大学共同打造的 AD-NeRF 技术,引发了学界及业界关注。来自中科大张举勇课题组等机构的研究者们在近期大火的神经辐射场(NeRF: Neural Radiance Fields)技术基础上,提出了一种由语音信号直接生成说话人视频的算法。仅需要目标人物几分钟的说话视频,该方法即可实现对该人物超级逼真的形象复刻和语音驱动。
论文题目
-
题目:AD-NeRF: Audio Driven Neural Radiance Fields for Talking Head Synthesis
-
作者团队:
-
会议:ICCV 2021
-
论文:https://arxiv.org/abs/2103.11078
-
代码:https://github.com/YudongGuo/AD-NeRF
任务定义
这篇文章主要针对的任务是talking face generation,也有一种说法是audio dri