FERAtt: Facial Expression Recognition with Attention Net-论文笔记

最新推荐文章于 2022-02-02 18:40:32 发布

Tender_Li

最新推荐文章于 2022-02-02 18:40:32 发布

阅读量655

点赞数

分类专栏：论文笔记文章标签： FERAtt 表情识别 CVPRW2019 人工智能深度学习

本文链接：https://blog.csdn.net/Tender_Li/article/details/108420691

版权

论文笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

这是一篇发布在CVPRW2019上面的文章，文章可以免费下载，并且提供了验证源代码，原文链接和代码链接都放在下面，有需要的小伙伴可以自取。

原文链接：FERAtt: Facial Expression Recognition with Attention Net

代码链接：Github地址

言归正传，这篇文章的主要内容首先是提出了一个新的网络架构——FERAtt，一个带有Attention机制的基于CNN的网络；其次是引入新的双分支网络加强对面部表情内核的学习；另外，文章给出了一个新的损失函数——结构高斯流损失（Structured Gaussian Manifold Loss）；最后文章给出了一个新的合成生成器进行数据扩充。

一、相关问题

近期FER研究中出现的问题：作者认为最近的FER研究，进行表情识别时，总是针对整张图像，而不去考虑在图像中的面部裁剪位置。这样会给表情识别带来额外的计算（包括人的毛发、珠宝等），也会引入噪声。

引入机制：Attention机制，人眼视觉感知能够快速解析视场，丢弃不相关的信息，然后将主要处理过程集中在一个特定的感兴趣的目标区域，即所谓的 $visual\, attention$ 机制。

解决方法：就是引入上述的 Attention 机制，通过模仿人类视觉机制，进行表情识别，如下图所示：

二、方法理论

（一）网络结构

网络主要包括四个部分： $Attention\, Module\, ,G_{att}$ ; $Feature\,Module\,,G_{ft}$ ; $Reconstruction\, Module\,,G_{rec}$ ; $Representation\,and\, Classification\, Module\,,G_{rec}$ ，网络结构如下图：

1. $Attention\, Module\,$

这是一个类似于人脸检测的模块，作者使用比较新颖的图像分割方法——U-net代替了人脸检测。具体结构可以看下面的图：

下面的图是这一个模块的具体效果，它生成输入图片的一张掩膜，也就是将输入图片的非人脸区域遮盖掉：

2. $Feature\,Module$

这一模块是为了从图像中获取基本的特征，并保留图像的空间信息。具体效果如下图所示：

3. $Reconstruction\, Module$

这一部分是将 $Feature\,Module$ 和 $Attention\, Module\,$ 的输出进行一个融合增强，为下面一个模块 $Representation\,and\, Classification\, Module\,,G_{rec}$ 提供输入，从而进行更好的分类。

具体的实现可以去阅读一下论文。

三、论文总结

文章提出了一种新的带有Attention机制的面部表情识别网络结构。
文章的工作在我看来主要集中在面部图像的预处理阶段，也就是使用人脸分割代替传统的人脸检测，去除人脸图片中于表情无关的因素，进而辅助 $Representation\,and\, Classification\, Module\,,G_{rec}$ 模块更好的进行表情的表示和分类。
数据扩充策略没有在博客中提到。文章还提出了一种新的数据扩充策略，这个策略就是从真实的面部表情数据集中检测和提取人脸，对提取出的人脸进行几何或光照等的变换，并将变换后的图片合成到新的背景图像数据库中，进而达到数据扩充的效果。
实验过程以及结果可以参照原文。。。。

Tender_Li

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
FERAtt: Facial Expression Recognition with Attention Net-论文笔记

这是一篇发布在CVPRW2019上面的文章，文章可以免费下载，并且提供了验证源代码，原文链接和代码链接都放在下面，有需要的小伙伴可以自取。原文链接：FERAtt: Facial Expression Recognition with Attention Net代码链接：Github地址言归正传，这篇文章的主要内容首先是提出了一个新的网络架构——FERAtt，一个带有Attention机制的基于CNN的网络；其次是引入新的双分支网络加强对面部表情内核的学习；另外，文章给出了一个新的损失函数——结构
复制链接

扫一扫

专栏目录