视频生成模型的脚步永不停歇!
图片
4月2日,谷歌刚刚发布了强到可怕的AI视频编辑工具VLOGGER。VLOGGER就像收集了很多视频生成领域的前沿AI技能,而打造出的一款百宝箱。其中也有一些亮点细节,例如通过AI编辑,将让画面中讲话者的闭眼、闭嘴、甚至“wink”。
这意味着视频编辑在细节的深入上又精进了一个level!
VLOGGER的工作原理即输入音频和图像, 由“读唇器”根据音频预测说话者的动作,而“动画器”根据说话者的照片和动作细节创建视频帧。
图片
要知道VLOGGER这个百宝箱里都装了什么,可以跟随以下示例来看!
1.VLOGGER的多面能力
基础的图生视频功能
将图片驱动为一段视频。