百度开源数字人项目Hallo，效果炸裂！

最新推荐文章于 2024-07-17 14:43:16 发布

学术Fun

最新推荐文章于 2024-07-17 14:43:16 发布

阅读量1.4k

点赞数 4

文章标签：人工智能 AIGC gpt 开源

本文链接：https://blog.csdn.net/duoshehuan6005/article/details/139757421

版权

最近，AI领域又迎来了一个重磅消息——百度联合复旦大学、苏黎世联邦理工学院和南京大学共同推出了一个名为"Hallo"的开源项目。在音频驱动的肖像动画生成方面，这个项目取得了令人瞩目的进展。

肖像图像动画，尤其是由语音音频输入驱动的动画，一直是计算机图形学中的一大难题。如何生成逼真且动态的肖像，同时确保面部动作与语音同步，是该领域研究的核心问题。

Hallo项目摒弃了传统的参数模型，采用了一种全新的端到端扩散范式。通过一个层次化的音频驱动视觉合成模块，显著提高了音频输入与视觉输出之间的对齐精度，包括嘴唇、表情和姿态动作。

学术Fun将上述工具制作成一键启动包，点击即可使用，避免大家配置环境出现各种问题，下载地址（电脑浏览器访问）： https://xueshu.fun/4787/，在此页面右侧区域点击下载！

注意电脑配置如下：

通过综合的定性和定量分析，Hallo项目在图像和视频质量、唇部同步精度以及动作多样性方面都显示出明显的提升。

Hallo项目不仅推动了肖像动画技术的发展，也为个性化和多样化的动画创作提供了新的可能性。随着技术的不断进步，我们期待未来能够看到更多令人惊叹的动画作品。

关注