MuseTalk 口型同步模型使用教程

最新推荐文章于 2024-08-30 17:27:40 发布

小白狮ww

最新推荐文章于 2024-08-30 17:27:40 发布

阅读量706

点赞数 6

文章标签：人工智能机器学习深度学习语言模型 python 大数据迁移学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/XLionXxxx/article/details/139534243

版权

MuseTalk 是一个实时高质量音频驱动的口型同步模型，是由腾讯音乐天琴实验室开发的一款专门用于虚拟人口型生成的模型，能够依据输入的音频来修改未见过的面部图像，使面部动作与音频高度同步，以达到口型与声音匹配的效果。

MuseTalk 在口型生成方面表现出色，能够生成准确且画面一致性良好的口型，尤其擅长真人视频生成。

使用平台：注册 - OpenBayes

登录到 OpenBayes 平台后，点击「公共教程」，找到「MuseTalk 高质量口型同步模型」教程。

进入该教程后，点击「克隆」-「下一步：选择算力」。页面跳转后，算力选择 RTX 4090，新用户别忘了使用我文章开头的邀请链接！选择 PyTorch 镜像后，点击「下一步：审核」。

等待系统分配资源，状态显示为运行忠厚，将鼠标移动到 API 地址这里，复制出现的API

地址链接至新的标签页打开，即可启动项目的 Gradio 界面。

在项目展示页面中，在 Driven Audio 框内上传音频文件，第 Reference Video 框内输入视频文件，然后点击 Generate，稍等片刻即可生成视频。

关注

6
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。