EMO - 阿里巴巴的表情驱动的音频到视频转换框架
EMO(Emote Portrait Alive)是一个先进的表情驱动的音频到视频转换框架,可以通过音频(比如说话或唱歌的声音)和一张单独的参考图片,生成带有丰富面部表情和头部姿势变化的肖像视频。这个框架的显著特点是能够根据音频的长度,生成任意时长的视频,同时保持角色身份的一致性。无论是处理不同语言的歌曲、使古代画像动起来,还是生成具有逼真动作和表情的三维或AI生成内容,EMO都能够轻松应对,注入生动的动态效果。此外,它还能够驾驭快速节奏,确保快速歌词与角色动画的同步。
https://humanaigc.github.io/emote-portrait-alive/
DepthFlow - 图片转换成2.5D视差效果视频的工具,是一个专业的Deephy替代品。
DepthFlow是一个开源工具,其主要功能是将静态图片转换成具有2.5D视差效果的视频。这种效果通过在图片中估计不同物体的深度,