Do Deep Neural Networks Learn Facial Action Units When Doing Expression Recognition?
摘要:
首先,我们对面部表情数据进行零偏CNN训练,并根据我们的知识,在两个表达式识别基准上实现最先进的表现:扩展Cohn-Kanade(CK +)数据集和多伦多面部数据集(TFD) 。然后,我们通过可视化最大程度地激发卷积层中的不同神经元的空间模式来定性分析网络,并显示它们如何类似于面部动作单元(FAU)。最后,我们使用CK +数据集中提供的FAU标签来验证在我们的过滤器可视化中观察到的FAU确实与被摄取的面部动作一致。
1. 引言
Paul Ekman提出了面部动作编码系统(FACS),其中列举了这些区域,并描述了每个面部表情如何被描述为多个动作单元(AU)的组合,每个动作单元对应于脸部特定的肌肉组。 然而,让计算机准确地学习传达情感的脸部部分被证明是一件不平凡的事情。
以前的面部表情识别工作可以分为两大类:基于AU的/基于规则的方法和基于外观的方法。 基于AU的方法将明确地检测个体AU的存在,然后基于Friesen和Ekman提出的组合对一个人的情感进行分类。 不幸的是,每个AU检测器都需要仔细的手工工程来确保良好的性能。 另一方面,基