人工智能技术应用笔记（六）：教大家如何免费让美女小姐姐开口说话（含纯CPU版攻略）

穿越光年

已于 2024-03-15 17:02:40 修改

阅读量1k

点赞数 30

分类专栏：人工智能技术应用文章标签：数字人制作人工智能

于 2024-03-15 15:32:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45512098/article/details/136741150

版权

人工智能技术应用专栏收录该内容

12 篇文章 6 订阅

订阅专栏

本篇为《人工智能技术应用》专栏的第六篇。希望以学习笔记的形式和大家一起了解和探索人工智能技术的实际应用。

《教大家如何免费让美女小姐姐开口说话》

最近数字人一直都是AI风口中的热点，Heygen是制作数字人的热门工具，但是要上网，更要钱啊。

最近找到一个可以在本地部署的数字人软件包，提供图片和音频就能自动合成出数字人说话视频，效果还是不错的，不管作为商用还是自己学习体验都是不错的选择。

想要看视频合成效果的请访问：数字人演示视频

这个软件包基本上直接能用，推荐给大家试一下。只有CPU的小伙伴也不用担心，也一样可以用，只是速度慢一些，具体数据看文章介绍。

今天就教大家如何免费让下面的美女小姐姐开口说话。

这个项目是Wav2Lip的升级版。处理一段9秒钟、720p、60fps的测试视频大概不到1分钟（这个是GPU版本的数据，纯CPU版本慢不少，具体数据在后面会说）

这里提供完整的已安装整合包供大家下载使用（windows环境可直接使用），下载后解压就能一键打开使用。大家只需要在本地电脑安装python环境即可。

一、默认GPU版本

解压包打开后就是上面图片中的文件，双击打开红圈中的run.bat批处理文件，自动启动项目：

双击run.bat，稍后会弹出命令窗口，在上面的命令窗口复制http://127.0.0.1:7860，在浏览器中粘贴打开就行了。

操作方法：

首先在上图界面中上传一张你选定的图片（注意：图片中只能有一张人脸，不能出现多人面容），再上传预先准备好的音频文件。直接点击生成，则视频合成开始。

对于首次使用者，左边方框中的选项先不要动，保持默认就可。待后面熟悉之后再慢慢调试。

如果不使用整合包，而是自己安装源代码时，安装顺序与其它项目大致相同，首先保证python大环境（保证环境变量path），然后是安装项目依赖模块（命令：pip install -r reqiurements.txt）。

在安装完所有内容之后，应该会弹出一个名为config.ini的文件。这是一个首次使用前的配置设置文件：

主要是把划红线的两个地方填上音频、视频的存放路径。这个根据个人情况填写就行了。其它默认。

二、纯CPU版本攻略

以上是默认有GPU跑CUDA的配置。如果是纯CPU的配置，运行的时候会报错。

需要修改源码中的原来指定使用cuda的地方，改为cpu即可。主要牵涉到两个文件easy_functions.py，inference.py，都在根目录下，下面给出具体要修改的地方。

easy_functions.py

#device = 'cuda'

device = 'cpu'

inference.py

#这是第一处

#device = 'cuda'

device = 'cpu'

#这是第二处

#device = 'cuda'

device = 'cpu'

#img_batch = torch.FloatTensor(np.transpose(img_batch, (0, 3, 1, 2))).to('cuda')

#mel_batch = torch.FloatTensor(np.transpose(mel_batch, (0, 3, 1, 2))).to('cuda')

img_batch = torch.FloatTensor(np.transpose(img_batch, (0, 3, 1, 2))).to('cpu')

mel_batch = torch.FloatTensor(np.transpose(mel_batch, (0, 3, 1, 2))).to('cpu')

#detector = RetinaFace(gpu_id=0, model_path="checkpoints/mobilenet.pth", network="mobilenet")

detector = RetinaFace(gpu_id=-1, model_path="checkpoints/mobilenet.pth", network="mobilenet")

三、修复生成视频的bug

最后还有一个坑要填。生成视频的时候会报错，是因为代码里调用ffmpeg生成视频用的参数不太对，需要修改的文件是inference.py，参照下面修改即可：

"""

subprocess.check_call([

f"{ffmpeg_path}", "-y", "-loglevel", "error",

"-i", "temp/result.mp4",

"-i", args.audio,

"-c:v", "h264_nvenc",

args.outfile ,

])

"""

subprocess.check_call([

f"{ffmpeg_path}", "-y", "-loglevel", "error",

"-i", "temp/result.mp4",

"-i", args.audio,

"-c:v", "copy", "-c:a", "aac",

args.outfile ,

])

四、纯CPU版的运行时间

有一说一，纯CPU跑起来是真心慢啊，一个7秒左右的音频，最后生成视频花了29分钟，不过最后看到美女图片能说话了，还是很开心的，作为学习和体验来说还是很不错的。

———————————————————————————————————————

软件获取方法：关注公众号【数字众生】并留言：数字人

关注微信公众号【数字众生】即刻获取干货满满的 “AI学习大礼包” 和 “AI副业变现指南”

关注

30
点赞
踩
19

收藏

觉得还不错? 一键收藏
打赏
0
评论
人工智能技术应用笔记（六）：教大家如何免费让美女小姐姐开口说话（含纯CPU版攻略）

有一说一，纯CPU跑起来是真心慢啊，一个7秒左右的音频，最后生成视频花了29分钟，不过最后看到美女图片能说话了，还是很开心的，作为学习和体验来说还是很不错的。最近找到一个可以在本地部署的数字人软件包，提供图片和音频就能自动合成出数字人说话视频，效果还是不错的，不管作为商用还是自己学习体验都是不错的选择。直接点击生成，则视频合成开始。只有CPU的小伙伴也不用担心，也一样可以用，只是速度慢一些，具体数据看文章介绍。最近数字人一直都是AI风口中的热点，Heygen是制作数字人的热门工具，但是要上网，更要钱啊。
复制链接

扫一扫

专栏目录

穿越光年 CSDN认证博客专家 CSDN认证企业博客

码龄5年

高新区有函信息技术咨询中心

56: 原创

7541: 周排名

2万+: 总排名

9万+: 访问

: 等级

1277: 积分

5401: 粉丝

687: 获赞

16: 评论

929: 收藏

私信

关注

热门文章

分类专栏

最新评论

人工智能学习与实训笔记（九）：Langchain + 百度大模型实战案例
GardeniaKnight: 请问一下我要是希望使用文心4.0的话，模型名字是什么呢
将 Python Django 的 Web 项目部署到 Vercel
Lohse245: DATABASES = {}老哥为啥我这样设置之后报错 ImproperlyConfigured at /login/ settings.DATABASES is improperly configured. Please supply the ENGINE value. Check settings documentation for more details. Request Method: GET Request URL: https://mango-trans-oygsycrr9-lohses-projects.vercel.app/login/ Django Version: 4.2.11 Exception Type: ImproperlyConfigured Exception Value: settings.DATABASES is improperly configured. Please supply the ENGINE value. Check settings documentation for more details. Exception Location: /var/task/django/db/backends/dummy/base.py, line 20, in complain Raised during: webappexample.views.login Python Executable: /var/lang/bin/python3.12 Python Version: 3.12.3 Python Path: ['/var/task', '/opt/python/lib/python3.12/site-packages', '/opt/python', '/var/lang/lib/python3.12/site-packages', '/var/runtime', '/var/lang/lib/python312.zip', '/var/lang/lib/python3.12', '/var/lang/lib/python3.12/lib-dynload', '/var/lang/lib/python3.12/site-packages', '/opt/python/
人工智能学习与实训笔记（九）：Langchain + 百度大模型实战案例
dong-dong: 是不是Python版本的问题？你的Python版本是？
人工智能学习与实训笔记（九）：Langchain + 百度大模型实战案例
dong-dong: 博主，请教一下，我导入文心一言模块报错 from langchain_wenxin.chat_models import ChatWenxin PydanticUserError: If you use `@root_validator` with pre=False (the default) you MUST specify `skip_on_failure=True`. Note that `@root_validator` is deprecated and should be replaced with `@model_validator`. 我的环境：Python 3.11.7
人工智能学习与实训笔记（九）：Langchain + 百度大模型实战案例
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

穿越光年 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。