【AI数字人】根据音频生成带动画的数字人

该博客介绍了如何使用人工智能框架EMAGE,根据音频和蒙面手势生成逼真的数字人全身动作。EMAGE结合了BEATX数据集,利用音频和身体姿势先验知识,通过联合训练生成面部和身体动作。该技术实现了高保真度和多样性的结果,并能在预定义的时空手势输入下生成同步的音频动画。
摘要由CSDN通过智能技术生成

 这是一个从音频和蒙面手势生成全身人体手势的框架,包括面部、局部身体、手和整体动作。为了实现这一目标,我们首先引入 BEATX (BEAT-SMPLXFLAME),一个新的网格级整体协同语音数据集。 BEATX 将 MoShed SMPLX 身体与 FLAME 头部参数相结合,进一步细化头部、颈部和手指运动的建模,提供社区标准化的高质量 3D 运动捕捉数据集。 EMAGE 在训练期间利用屏蔽的身体姿势先验来提高推理性能。它涉及一个屏蔽音频手势转换器,促进音频手势生成和屏蔽手势重建的联合训练,以有效地编码音频和身体手势提示。然后,将来自蒙面手势的编码身体提示分别用于生成面部和身体动作。此外,EMAGE 自适应地合并来自音频节奏和内容的语音特征,并利用四种组合 VQVAE 来增强结果的保真度和多样性。实验表明,EMAGE 可以生成具有最先进性能的整体手势,并且可以灵活地接受预定义的时空手势输入,生成完整的音频同步结果。

 

  • 4
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

花生糖@

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值