FERAtt: Facial Expression Recognition with Attention Net-论文笔记

这是一篇发布在CVPRW2019上面的文章,文章可以免费下载,并且提供了验证源代码,原文链接和代码链接都放在下面,有需要的小伙伴可以自取。

原文链接:FERAtt: Facial Expression Recognition with Attention Net

代码链接:Github地址

言归正传,这篇文章的主要内容首先是提出了一个新的网络架构——FERAtt,一个带有Attention机制的基于CNN的网络;其次是引入新的双分支网络加强对面部表情内核的学习;另外,文章给出了一个新的损失函数——结构高斯流损失(Structured Gaussian Manifold Loss);最后文章给出了一个新的合成生成器进行数据扩充。

一、相关问题

近期FER研究中出现的问题:作者认为最近的FER研究,进行表情识别时,总是针对整张图像,而不去考虑在图像中的面部裁剪位置。这样会给表情识别带来额外的计算(包括人的毛发、珠宝等),也会引入噪声。

引入机制:Attention机制,人眼视觉感知能够快速解析视场,丢弃不相关的信息,然后将主要处理过程集中在一个特定的感兴趣的目标区域,即所谓的visual\, attention机制。

解决方法:就是引入上述的Attention机制,通过模仿人类视觉机制,进行表情识别,如下图所示:

二、方法理论 

(一)网络结构

网络主要包括四个部分:Attention\, Module\, ,G_{att}Feature\,Module\,,G_{ft}Reconstruction\, Module\,,G_{rec}Representation\,and\, Classification\, Module\,,G_{rec},网络结构如下图:

 1. Attention\, Module\,

这是一个类似于人脸检测的模块,作者使用比较新颖的图像分割方法——U-net代替了人脸检测。具体结构可以看下面的图:

 下面的图是这一个模块的具体效果,它生成输入图片的一张掩膜,也就是将输入图片的非人脸区域遮盖掉:

 2. Feature\,Module

这一模块是为了从图像中获取基本的特征,并保留图像的空间信息。具体效果如下图所示:

 3. Reconstruction\, Module

这一部分是将Feature\,ModuleAttention\, Module\,的输出进行一个融合增强,为下面一个模块Representation\,and\, Classification\, Module\,,G_{rec}提供输入,从而进行更好的分类。

具体的实现可以去阅读一下论文。

三、论文总结

  1. 文章提出了一种新的带有Attention机制的面部表情识别网络结构。
  2. 文章的工作在我看来主要集中在面部图像的预处理阶段,也就是使用人脸分割代替传统的人脸检测,去除人脸图片中于表情无关的因素,进而辅助Representation\,and\, Classification\, Module\,,G_{rec}模块更好的进行表情的表示和分类。
  3. 数据扩充策略没有在博客中提到。文章还提出了一种新的数据扩充策略,这个策略就是从真实的面部表情数据集中检测和提取人脸,对提取出的人脸进行几何或光照等的变换,并将变换后的图片合成到新的背景图像数据库中,进而达到数据扩充的效果。
  4. 实验过程以及结果可以参照原文。。。。
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值