深度学习：基于卷积神经网络的人脸面部表情识别

人工智能王小鸿

已于 2023-11-08 15:11:59 修改

阅读量1.3k

点赞数 2

文章标签：深度学习 cnn 人工智能

于 2023-11-08 12:29:57 首次发布

本文链接：https://blog.csdn.net/m0_73800456/article/details/134275819

版权

本文介绍了基于深度学习的卷积神经网络（ResNet18）进行人脸表情识别的方法。首先，利用Adaboost进行图像预处理，然后在Kaggle人脸表情数据集上训练预训练的ResNet18模型，使用CrossEntropyLoss作为损失函数。经过超参数调整，模型在测试集上表现出良好效果，展示了卷积神经网络在人脸识别领域的应用。

摘要由CSDN通过智能技术生成

前言

人工智能与机器视觉技术的迅速发展，掀起了图像处理领域发展的浪潮，
深度学习算法也逐渐步入人们的视线。人脸面部表情识别作为人机交互的一个重要
组成部分，利用深度学习算法实现对人脸面部表情的识别和分类成为了各界学者研
究的热点问题。

论文主要是对人脸面部表情进行识别分类。首先运用 Adaboos 算法对人脸面
部表情图像进行粗略的裁剪，再利用梯度积分投影和双阈值二值化对人脸面部表情
图像中的人眼进行定位从而实现对人脸面部图像的精确裁剪；对于裁剪好的图像又
对其进行了基于双线性插值的尺度归一化处理和基于均衡化算法的灰度归一化处
理，得到最终的统一尺寸和统一灰度的人脸面部表情图像。

数据介绍

Kaggle是Kaggle人脸表情分析比赛提供的一个数据集。该数据集含28709 张训练样本，3859 张验证数据集和3859 张测试样本，共35887 张包含生气、厌恶、恐惧、高兴、悲伤、惊讶和正常七种类别的图像，图像分辨率为48×48。该数据集中的图像大都在平面和非平面上有旋转，并且很多图像都有手、头发和围巾等的遮挡物的遮挡。该数据库是2013年Kaggle比赛的数据，由于这个数据库大多是从网络爬虫下载的，存在一定的误差性。这个数据库的人为准确率是65%±5%。