几篇近期的paper:
- 清华:音频驱动的具有自然头部姿势的语音人脸视频生成
- 谭铁牛:对步态识别的时间稀疏对抗性攻击
- Google Brain:无需专用硬件加速的混合精度量化
- 北大:SemanticPOSS-具有大量动态实例的点云数据集
1. 清华:音频驱动的具有自然头部姿势的语音人脸视频生成
类似于AI虚拟主播,根据声音生成视频,嘴型和头的姿态越来越自然……Fake News批量化生产指日可待【狗头】,先看一段视频,不是本文的Demo哈,是一张图片生成视频的:
语音人脸视频生成Demo
AI视频生成
标题:Audio-driven Talking Face Video Generation with Natural Head Pose
机构:清华、中科大、