论文阅读:3D-TalkEmo: Learning to Synthesize 3D Emotional Talking Head

  • 这个好像还没见刊

输入输出

输入是neutral 3d mesh 和一段声音信号
输出是 带有情绪的人脸动画

背景

现在3d emotion dataset 比较少

贡献

  1. 创建了一个3d 数据集
  2. 端到端的对3d talking head animation的框架
  3. 提出了新型的3d face的表达方式

方法

概括来说有3点:

  1. 提取音频信息
  2. 预测顶点变换
  3. 情绪变换, 生成3d mesh data (情绪这里是离散的标签)

在这里插入图片描述

3d 重建

这里对3d model的表达是这样的, 不和3dmm一样
在这里插入图片描述
这里是用2d 的landmarks来拟合3d
在这里插入图片描述
使用了正交投影 orthographic projection
在这里插入图片描述

情绪增强

因为数据比较少, 于是选择了3个情绪分别是开心, 惊讶, 生气这三个情绪进行增强, 增强方法原文写的不是很容易理解, 贴出原文:

在这里插入图片描述

Representation of 3D Mesh as Image

这部分直接贴出做法, 因为它讲的实在是不怎么清楚
在这里插入图片描述

核心点就是之前的预测都是直接的预测点, 没有考虑点和点之间的关系, 这个构建是使用了测地线距离, 同时使用MDS方法降维, 这样保留了连接信息
在这里插入图片描述

Neutral Talking Model

直接从语音预测的部分是使用了别人的工作, Capture, learning, and synthesis of 3d speaking styles. 挺好的一篇文章
不过这里的点还是不太一样, 原文的模型是5023个点, 现在的模型是12483个点.

Emotion Transfer

使用StarGan做的

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

live_for_myself

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值