![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音驱动说话人
文章平均质量分 93
胖胖腐乳
来自广东广州的一枚程序猿,在做方向为计算机视觉人像美颜、虚拟数字人。
展开
-
EMO: Emote Portrait Alive 译文
我们提出了EMO,一种表达性音频驱动的人像视频生成框架。输入单个参考图像和语音音频,例如说话和唱歌,我们的方法可以生成具有表达性面部表情和各种头部姿势的语音化身视频,同时,我们可以根据输入音频的长度生成任何持续时间的视频。翻译 2024-03-04 16:39:00 · 282 阅读 · 0 评论 -
StyleHEAT: One-Shot High-Resolution Editable Talking Face Generation via Pre-trained StyleGAN 译文
图1。我们的统一框架支持高分辨率的通话人脸生成,通过驾驶视频或音频解除纠缠控制,以及灵活的人脸编辑。我们的方法首次将一次性会说话的人脸生成的分辨率提高到1024×1024。第一行显示了一个视频驱动的交叉身份再现的合成视频。第二行显示了一个由音频驱动的嘴唇运动生成的合成视频。第三行显示,在谈话视频生成过程中,我们可以通过GAN倒置在任何时间戳上一致地自由编辑面部属性。第四行显示,我们可以基于嵌入式3DMM执行直观的人脸编辑以及会说话的人脸生成。翻译 2023-07-18 16:08:10 · 720 阅读 · 0 评论 -
3D Talking Face with Personalized Pose Dynamics 论文翻译
链接论文:https://personal.utdallas.edu/~xxg061000/TVCG2021.pdf相关视频:https://www.youtube.com/watch?v=KflYlxiia5Q1. 介绍图3。我们的统一框架概述。GposeG_{pose}Gpose 表示三维头部姿势序列的生成器,DposeD_{pose}Dpose表示鉴别器。面形状参数由PGFace生成。对话人脸生成是计算机视觉和图形学中一个非常有吸引力的研究课题。除了有趣之外,它还有广泛的应用,原创 2021-10-18 15:48:47 · 1298 阅读 · 0 评论 -
SadTalker: Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking
我们提出了SadTalker,它从音频中生成3DMM的3D运动系数(头部姿势,表情),并隐式调制了一种新颖的3D感知面部渲染,用于说话的头部生成。为了学习真实的运动系数,我们明确地分别模拟音频和不同类型的运动系数之间的联系。准确地说,我们提出ExpNet通过提取系数和3d渲染的面部来从音频中学习准确的面部表情。对于头部姿势,我们通过一个有条件的VAE来设计PoseVAE来合成不同风格的头部运动。最后,将生成的三维运动系数映射到所提出的人脸渲染的无监督三维关键点空间,并合成最终的视频。翻译 2023-03-14 09:49:55 · 4498 阅读 · 1 评论 -
One-Shot Face Reenactment on Megapixels 译文
One-Shot Face Reenactment on Megapixels 译文翻译 2023-03-06 14:40:15 · 628 阅读 · 0 评论 -
Imitating Arbitrary Talking Style for Realistic Audio-Driven Talking Face Synthesis 译文
Imitating Arbitrary Talking Style for Realistic Audio-Driven Talking Face Synthesis模仿任意说话风格进行真实音频驱动的人脸合成翻译 2023-03-06 14:34:09 · 760 阅读 · 0 评论 -
Face2Faceρ: Real-Time High-Resolution One-Shot Face Reenactment 译文
Face2Faceρ: Real-Time High-Resolution One-Shot Face Reenactment 译文翻译 2023-03-06 14:23:17 · 1390 阅读 · 0 评论 -
Meta Talk: Learning To Data-Efficiently Generate Audio-Driven Lip-Synchronized Talking 论文解读
Meta Talk: Learning To Data-Efficiently Generate Audio-Driven Lip-Synchronized Talking 论文解读原创 2023-03-06 14:15:44 · 701 阅读 · 0 评论