让照片开口讲话,让视频人物对口型

代码地址:https://github.com/Rudrabha/Wav2Lip
我用的python版本是3.10

1. 安装ffmpeg
windows:https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-full.7z解压后bin目录添加到环境变量。
Ubuntu:apt-get install ffmpeg
2. 安装依赖

 pip install -r requirements.txt

直接安装,使用cpu处理音视频文件,处理速度较慢
或者(有显卡的)删除requirements.txt里面的torch、torchvision,从https://pytorch.org/get-started/locally下载gpu版本
在这里插入图片描述
在这里插入图片描述
执行命令

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

3. 下载人脸切割处理模型

下载https://www.adrianbulat.com/downloads/python-fan/s3fd-619a316812.pth放入Wav2Lip-master\face_detection\detection\sfd目录并且重命名为s3fd.pth
在这里插入图片描述

4. 下载权重模型
点此下载权重文件放入项目根目录
在这里插入图片描述

5. 准备一张人物照片或者人物视频(人脸清晰),一个音频(视频)文件
在这里插入图片描述

python inference.py --checkpoint_path wav2lip_gan.pth --face video.mp4 --audio audio.mp3

结果在results文件夹中
在这里插入图片描述

6. 看效果
图片效果:


视频效果(视频经过其他处理):

  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 20
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 20
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值