摘要: 针对ResNet50中的Bottleneck经过1×1卷积降维后主干分支丢失部分特征信息而导致在表情识别中准确率不高的问题,本文通过引入Ghost模块和深度可分离卷积分别替换Bottleneck中的1×1卷积和3×3卷积,保留更多原始特征信息,提升主干分支的特征提取能力;利用Mish激活函数替换Bottleneck中的ReLU激活函数,提高了表情识别的准确率;在此基础上,通过在改进的Bottleneck之间添加非对称残差注意力模块(asymmetric residual attention block, ARABlock)来提升模型对重要信息的表示能力,从而提出一种面向表情识别的重影非对称残差注意力网络(ghost asymmetric residual attention network, GARAN)模型。对比实验结果表明,本文方法在FER2013和CK+表情数据集上具有较高的识别准确率。
- 关键词:
- 表情识别 /
- 特征提取 /
- ResNet50 /
- Ghost模块 /
- Mish /
- 非对称残差注意力 /
- 深度可分离卷积 /
- 深度学习
表情识别是通过人类的面部表情来判断情绪的一种手段。在最近的工作中,微表情识别逐渐成为该领域的研究热点。微表情持续时间短、难以捕捉,却表达了人试图压抑与隐藏的真实情感,在自动测谎、心理咨询以及临床诊断等方面有着很高的研究价值及应用前景[1]。目前,基于卷积神经网络(convolutional neural networks, CNN)的表情识别方法取得了不错的进展[2-4]。文献[5]提