使用数字人SadTalker创建免费AI主播

AI高工

已于 2024-03-15 16:45:00 修改

阅读量1.4k

点赞数 8

分类专栏： AIGC 文章标签：数字人人工智能 ai AIGC

于 2024-03-15 14:35:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42672770/article/details/136739135

版权

本文介绍了GitHub项目SadTalker，一个能结合图片和音频生成逼真视频的工具，探讨了其潜在的应用和未来可能的发展。详细讲解了如何在Python环境下，通过Anaconda和NVIDIACUDAToolkit等工具安装和配置，以及使用gfpgan模型进行项目操作的步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

很有趣的GitHub项目SadTalker，它能够将一张图片跟一段音频合成一段视频，看起来毫无违和感，如果不仔细看，甚至很难辨别真假，预计未来某一天，一大波网红即将失业。

虽然这个项目目前的主要研究方向还是基于cuda的脸部训练，生成动态的视频，但如果能够接入语音服务，利用ChatGPT实时生成对话prompt，配合这个项目实时渲染动态视频，那么一个灵动的对话机器人就产生了。想想这两个月ai正在以可怕的速度进化，未来生命以数字形式留存，机械飞升不再是科幻小说才有的场景。

使用教程
SadTalker上手门槛低，对新手相当友好，按照我的步骤一步步进行将确保你能够正常玩转这个项目。

使用sadtalker的方式有两种：

第一种方式可以在stable diffusion上安装sadtalker插件，传送门：stable diffusion上安装数字人sadtalker插件-CSDN博客

第二种方式是跑源码，这是本文下面要展开讲的。

一、环境准备
1、安装 Anaconda
Anaconda 本身是一个python发行版本，它可以便捷获取包且对包能够进行管理，同时对环境可以统一管理。Anaconda包含了conda、Python在内的超过180个科学包及其依赖项。

Anaconda 与 Python 的区别在于，Anaconda 是一个发行版，提供了一组科学计算和数据分析的常用工具，而 Python是一种编程语言。Ana

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。