基于之前的AI主播的的学习基础 基于Wav2Lip的AI主播 和 基于Wav2Lip+GFPGAN的高清版AI主播,这次尝试一下VideoRetalking生成效果。
总体来说,面部处理效果要好于Wav2Lip,而且速度相对于Wav2Lip+GFPGAN也提升很多,也支持自由旋转角度,但是如果不修改源码的情况下,视频的部分截取稍微有点问题。
这个训练图片还好,如果是做视频的话还是比较吃GPU资源的 16G显存是个起步配置。
文章目录
准备工作
从github上下载源码,下载完毕之后下载模型 SadTalker v0.0.1 Release Note。
模型分这么多种类,如果使用哪个模型将该文件夹下的内容复制到 checkpoints 中。