【摘 要】针对人脸表情变化细微易受到非表情区域影响、传统神经网络提取难以提取有效特征等问题,提出了一种结合级联框架与注意力机制的人脸表情识别方法。首先,通过级联框架模型排除人脸图像的多余干扰;其次在深度有效网络中引入注意力机制从通道和空间维度上进行注意权重推断,以增强表情特征的表达能力,抑制冗余信息的影响;最后采用Focal loss损失函数进一步减弱数据集分布不均衡带来的影响。实验结果表明,该方法在公开数据集FER2013、JAFFE上分别取得了72.42%和95.71%的识别准确率,与其他算法相比具有一定先进性与优越性。
【关键词】面部表情识别;深度学习;级联框架;注意力机制
0 引言
面部表情是传播人类情感信息、协调人际关系的重要方式。相关研究表明,在人类日常交流中,通过语言传递的信息仅占总信息量的7%,而通过面部表情传递的信息则达到总信息量的55%。由于面部表情识别在社交机器人、医疗、驾驶员疲劳监测等众多人机交互系统中的实际重要性,许多研究人员对面部表情识别进行了大量研究。早在20世纪,Ekman和Friesen[1]在一项跨文化研究[2]的基础上定义了六种基本情绪,表明人类对某些基本情绪的感知方式与文化无关。这些典型的面部表情是愤怒、厌恶、恐惧、快乐、悲伤和惊讶,轻蔑随后被添加为基本情绪之一。
大多数传统方法使用手工制作的特征或浅层学习(LBP, Local Binary Pattern)[3]、Gabor小波特征[4]、三个正交平面上的LBP(LBP-TOP)[5]、非负矩阵分解(NMF)[6]和稀疏学习[7]等)用于面部表情识别。这些方法在早期特征提取中具有良好的性能,并已在许多应用中