访问地址:进入
该教程为 MegActor 的 Demo,只需克隆启动并打开 API 地址即可体验。MegActor 是由 MEGVII Technology(旷视科技)研发的一项人像动画生成器,它使用原始视频作为驱动因素来生成逼真生动的说话头部视频。具体来说,研究团队利用了两个 unet:一个从源图像中提取身份和背景特征,另一个精确地生成和整合直接从原始视频中提取的运动特征。MegActor 可以在低质量、公开可用的数据集上进行训练,并且在面部表情、姿势多样性、微妙的可控性和视觉质量方面表现出色。
这项技术属于无需中间表示 (intermediate-representation-free) 的肖像动画领域,能够使用原始视频作为驱动因素,直接生成逼真且生动的头像视频。MegActor 的核心优势在于它摒弃了传统动画制作中作为中介的表示形式,转而直接利用原始视频数据来创造动画,这大大提升了动画制作的效率和质量。