数字人开源代码:audio2head音频加单张图像驱动视频生成

项目地址:

wangsuzhen/Audio2Head: code for paper "Audio2Head: Audio-driven One-shot Talking-head Generation with Natural Head Motion" in the conference of IJCAI 2021 (github.com)

论文地址:

Audio2Head: Audio-driven One-shot Talking-head Generation with Natural Head Motion (ijcai.org)

1、下载代码:
git clone https://github.com/TMElyralab/MuseTalk.git
2、安装环境
创建conda环境:
conda create -n audio2head python=3.6
conda activate audio2head

安装依赖
先安装一个python3.6适配的opencv
pip install opencv-python==4.3.0.38
安装requirements.txt
pip install -r requirements.txt
下载模型

也可以在我的资源获取:【免费】audio2head预处理文件资源-CSDN文库

3、运行推理代码
python inference.py --audio_path ./demo/audio/intro.wav --img_path ./demo/img/trump.jpg

出现问题:

这个问题在issues中有人提到,并且有解决办法,附上链接issuses TypeError: load() missing 1 required positional argument: 'Loader' · Issue #8 · wangsuzhen/Audio2Head · GitHub

将inference.py中的load改成safe_load可以解决

修改后继续运行,又出错了:

经试验,安装版本0.3.0不会出错

pip install imageio-ffmpeg==0.3.0

继续运行,成功了,结果保存在results中

  • 5
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值