SyncTalk模型的安装、训练和推理方法

conda activate synctalk
cd I:\AI\SyncTalk\SyncTalk-Windows\face-SyncTalk\SyncTalk
SET PATH=..\venv\ffmpeg;%PATH%
python data_utils/process.py data/<ID>/<ID>.mp4 --asr ave

预处理命令

预处理结果

运行数据预处理程序时，需注意，运行完毕，检查bs.npy文件是否生成，有时会无法生成这个文件，此时需要运行以下命令生成此文件

python data_utils/blendshape_capture/main.py --path I:\AI\SyncTalk\SyncTalk-Windows\face-SyncTalk\SyncTalk\data\test3

训练

1、运行命令

设置环境变量

SET PATH=..\venv\ffmpeg;%PATH%

初步训练，会训练到11轮，模型有了初步的效果，建议进一步训练，*.pth为模型的权重（weights）和偏置（biases）。
python main.py data/test3 --workspace model/trial_test3 -O --iters 60000 --asr_model ave

进一步训练，再训练8轮

python main.py data/test3 --workspace model/trial_test3 -O --iters 100000 --finetune_lips --patch_size 64 --asr_model ave

至此，模型训练基本完成，如果一切顺利，能得到效果较好的推理结果。但有时会出现双下巴的情况，可能是训练视频质量的问题，可以尝试进一步训练，解决双下巴的问题，但如果训练视频的质量不佳，可能还是解决不了双下巴的问题。

python main.py data/test3/ --workspace model/trial_test3_torso/ -O --torso --head_ckpt model/trial_test3/checkpoints/ngp_ep0019.pth --iters 150000 --asr_model ave

此命令会训练到28轮。

2、训练结果

训练结果如下图

推理

1、准音频

准备wav文件，文件不限长度，放入SyncTalk-Windows\face-SyncTalk\SyncTalk\demo

2、命令

设置环境变量

SET PATH=..\venv\ffmpeg;%PATH%

没有进行修复下巴训练的情况

python main.py data/test3 --workspace model/trial_test3 -O --test --test_train --asr_model ave --portrait --aud ./demo/test.wav

进行修复下巴训练的情况

python main.py data/test3 --workspace model/trial_test3_torso -O  --torso --test --test_train --asr_model ave --aud ./demo/test.wav

3、运行结果

5分钟素材创造超写实人物形象

ScottOcp

关注

9
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
SyncTalk模型的安装、训练和推理方法

SyncTalk仅使用5分钟的说话视频即可生成高真实感的人物形象。本文介绍了synctalk、以及它的安装、训练和推理方法。
复制链接

扫一扫

专栏目录