GANimation: Anatomically-aware Facial Animation from a Single Image

GANimation: Anatomically-aware Facial Animation from a Single Image

paper motivation

近期生成对抗网络(GAN)在人脸表情合成任务中取得了惊人的表现,其中最成功的架构是 StarGAN,但该架构只能生成不连续的表情。为突破这一局限,本文提出了一种基于动作单元(AU)标注的新型 GAN 条件化方法,可以从单张图像和表情编码生成连续的表情动画,生成的图像具备连贯性、真实性、广泛性、鲁棒性。该方法以完全无监督的方式进行训练,使用符合人类解剖结构的面部动作编码系统来编码面部表情。
在这里插入图片描述

主要创新点

1)GANimation将Action Units(AU)与GAN结合。AU就是动作单元,利用动作单元来描述面部表情,动作单元在解刨学上与特定的面部肌肉收缩有关。动作单元的数量不多,只有不到30个,但是可以通过将动作单元进行组合有7000多种面部表情。比如一个恐惧的面部表情可以是AU1,AU2,AU4…等的结合。通过设置参数来控制一组合目标动作单元(AU)的激活程度,从而实现了对人脸表情的渐变插值过程。(2)将Attention引入到了模型中。生成网络包含两部分, G A G_A GA输出注意力掩模 A A A G I G_I GI输出的是RGB掩模 C C C。最后结果是 ( 1 − A ) ⋅ C + A ⋅ I y o ( 1 - \mathbf { A } ) \cdot \mathbf { C } + \mathbf { A } \cdot \mathbf { I } _ { \mathbf { y } _ { o } } (1A)C+AIyo, I y o \mathbf { I } _ { \mathbf { y } _ { o } } Iyo是输入图像。通过引入Attention可以用于克服生成图片中背景和光照的影响。

主要思想

一种无监督条件生成对抗网络。
什么是AU在这里插入图片描述
医学上会把人脸肌肉分为不同的区域,那么人脸做出表情的时候,某些区域会有不同程度的变化,比如说左边这个图,这个惊恐的表情,有这些部位会有不同程度的运动。这个数据集就是记录了人脸做各种表情的时候各个区域的变化程度。一般的表情数据集的label都是说这个人脸是什么表情,那这个数据集的label不是离散的各种表情的定义,而是用向量来表示各个区域不同程度的表情变化。通过调节表情向量就可以使这篇文章的模型输出不同程度的表情。这个向量就长下面这个样子,向量长度为N,表示脸部N个区域,每个值的范围从0到1.表示运动程度。 y r = ( y 1 , y 2 , … , y N ) T y _ { r } = \left( y _ { 1 } , y _ { 2 } , \dots , y _ { N } \right) ^ { T } yr=(y1,y2,,yN)T . 作者使用了EmotioNet数据集

网络结构

如上图所示,网络由一组生成网络G和判别网络D组成。生成网络和判别网络分别由两个子网络组成。模型的输入图像定义为图像 I y r I_ { y_{ r} } Iyr和目标单元 y g y_ { g } yg 的合并。生成网络 G A G_A GA回归一个注意力掩码,用来只关注人脸忽略背景 ; G I G_I GI用来生成颜色掩码。判别网络 D I D_I DI用来判别生成的图片的真实性; D y D_y Dy用来回归输出图像的目标动作单元。

具体看生成网络,其不是回归整个图片,而是输出了两个掩码,一个注意力掩码 A A A和一个RGB颜色掩码。最终的输出图像由 ( 1 − A ) ⋅ C + A ⋅ I y o ( 1 - \mathbf { A } ) \cdot \mathbf { C } + \mathbf { A } \cdot \mathbf { I } _ { \mathbf { y } _ { o } } (1A)C+AIyo,得出 I y f \mathbf { I } _ { \mathbf { y } _ { f } } Iyf

损失函数

Adversarial Loss
用来判别生成图像的真实性,作者使用了WGAN_GP
E I y o ∼ P o [ D I ( G ( I y o ∣ y f ) ) ]

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值