复现Live Speech Portraits算法总结
git地址:https://github.com/YuanxunLu/LiveSpeechPortraits
介绍
Live Speech Portraits: Real-Time Photorealistic Talking-Head Animation
环境设置
创建新的环境:conda create -n LSP python=3.6
进入环境:conda activate LSP
克隆项目:git clone https://github.com/YuanxunLu/LiveSpeechPortraits.git
进入项目:cd LiveSpeechPortraits
需要 FFmpeg 来组合音频和无声生成的视频(我是linux用户):sudo apt-get install ffmpeg
安装依赖:pip install -r requirements.txt
测试
将预训练的模型和数据从Google Drive 下载到data文件夹中。发布了五个主题数据(May、Obama1、Obama2、Nadella 和 McStay)
python demo.py --id May --driving_audio ./data/Input/00083.wav --device cuda
结果在rusults文件夹里
遇到的问题
1.ModuleNotFoundError:NO module named ‘numba.decorators’
包的冲突 重装一下numba包 :
pip install numba==0.48.0 -user
2.CUDA error问题 cuda和pytorch版本不兼容 用的是3090的卡 对cuda版本有要求 装的是11.0版本的
3.遇到个pt相关问题 改了代码