step1:准备工作
下载软件包:SadTalker.rar_免费高速下载|百度网盘-分享无限制 (baidu.com)
解压在一个位置,我的在这个位置
step2:配置环境
-
运行anaconda prompt(上面那个也可以)
-
进入step1解压好的sadtalker文件夹:
//我的sadtalker文件夹在D:\Program Files (x86)\SadTalker //先进入D盘 d: //cd进入SadTalker文件夹目录 cd D:\Program Files (x86)\SadTalker
-
创建环境、进入环境
//创建一个 名称叫 sadtalker 的环境 他的python环境版本是3.8 conda create -n sadtalker python=3.8 //进入环境 conda activate sadtalker
-
安装pytorch
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
注意:上述命令是官方安装方法,下载速度可能很慢
解决方法:在后面加一个清华源
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 -i https://pypi.tuna.tsinghua.edu.cn/simple
-
安装ffmpeg
conda install ffmpeg
-
下载安装默认的requirements.txt配置文件
pip install -r requirements.txt
注意:这步可能报错 解决方案:后面夹一个阿里云的源
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple
-
查看当前虚拟环境的安装目录
conda env list
-
剪切模型
把step1解压好的文件里面的:gfpgan\weights\GFPGANv1.4.pth 剪切到虚拟环境的 Lib\site-packages\gfpgan\weights 目录下
step3:生成视频
python inference.py --driven_audio e:\temp\sadtalker\speech_0.wav --source_image e:\temp\sadtalker\1.png --result_dir e:\temp\sadtalker --still --preprocess full --enhancer gfpgan
e:\temp\sadtalker\speech_0.wav 替换成 你的语音文件
e:\temp\sadtalker\1.png 替换成你的图片
e:\temp\sadtalker 替换成你的输出目录
注意:这步可能报错
ModuleNotFoundError: No module named ‘torchvision.transforms.functional_tensor‘
解决方案 :找到报错文件,将 ‘torchvision.transforms.functional_tensor’替换成’torchvision.transforms._functional_tensor‘
AttributeError: _2D
解决方案:找到报错文件_2D出现的地方,将 _2D 替换成 TWO_D