数字人已不是什么新鲜名词了。在许多领域,尤其是媒体和娱乐领域,经常可以看到卡通形象的人物或逼真的虚拟主持人。在Stable Diffusion中,我们可以上传一段录制好的音频文件,然后使用SadTalker插件,将音频和图片相结合,让图片上的角色开口说话。
在 WebUI中单击 “SadTalker”选项卡,在 “上传图像”窗口中上传角色图片,在“上传音频或TTS”窗口中上传音频文件,如图所示。
在右侧的“设置”窗口中选择脸部模型的分辨率,勾选“使用GFPGAN增强面部” 复选框,然后单击“生成”按钮,如图所示。
提 示:
上传的音频时 长决定了生成视频的时长,在 绘世启动器进程窗口的底部可 以查看生成进度。
视频生成完毕后,我们可以在下方的窗口中预览视频效果。单击WebUI上方的“设 置”选项卡,在左侧的列表中单击“SadTalker”,就能看到视频文件的输出路径,如图所示。
相对于其他插件来说 , SadTalker的配置较为复杂。如果配 置出现问题导致在输出路径中找不到 视频文件,则可以单击预览窗口右上 角的 按钮手动保存处理好的视频文 件,如图所示。
在“预处理”选项组中有5 个选项,其中“裁剪”和“裁剪 后扩展”选项会把上传的原图裁 剪成只留下角色的面部,让头部 运动看起来更加自然,如图所示。
“完整”选项不对参考图进行裁 剪,因此当角色的头部运动较大时, 可能出现脖子区域撕裂的问题。此时 需要勾选“静止模式”复选框,以 减少角色的头部运动。“缩放”选项 让参考图的背景和角色的身体产生缩 放和平移运动,脖子区域的撕裂问题 仍然存在,并且运动的效果也不够自 然。另外,选择“填充至完整”选项 会用参考图填充头部以外的区域,但 如果参考图的宽高比不是1:1,可能会出现严重的画面撕裂,如图所示。
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。