项目地址:
论文地址:
Audio2Head: Audio-driven One-shot Talking-head Generation with Natural Head Motion (ijcai.org)
1、下载代码:
git clone https://github.com/TMElyralab/MuseTalk.git
2、安装环境
创建conda环境:
conda create -n audio2head python=3.6
conda activate audio2head
安装依赖
先安装一个python3.6适配的opencv
pip install opencv-python==4.3.0.38
安装requirements.txt
pip install -r requirements.txt
下载模型
也可以在我的资源获取:【免费】audio2head预处理文件资源-CSDN文库
3、运行推理代码
python inference.py --audio_path ./demo/audio/intro.wav --img_path ./demo/img/trump.jpg
出现问题:
这个问题在issues中有人提到,并且有解决办法,附上链接issuses TypeError: load() missing 1 required positional argument: 'Loader' · Issue #8 · wangsuzhen/Audio2Head · GitHub
将inference.py中的load改成safe_load可以解决
修改后继续运行,又出错了:
经试验,安装版本0.3.0不会出错
pip install imageio-ffmpeg==0.3.0
继续运行,成功了,结果保存在results中