人脸识别介绍

最新推荐文章于 2025-03-14 10:40:51 发布

@DWC_DIP

最新推荐文章于 2025-03-14 10:40:51 发布

阅读量1k

点赞数 1

分类专栏：机器学习系列文章标签：人脸识别神经网络卷积机器学习

本文链接：https://blog.csdn.net/DIPDWC/article/details/118002621

版权

本文介绍了人脸识别的发展，重点讲述了深度学习在人脸识别中的应用，包括L-SoftMax、CosFace、ArcFace和Triplet Loss等损失函数的改进，以及在构建人脸识别系统时的关键步骤和技巧。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 目标

在这一讲中，我们将以人脸识别为具体应用，讲解如何用深度神经网络构建一个实用的人脸识别系统。

2. 人脸识别的发展

首先，回顾人脸识别邻域近年来的发展，在2013年AlexNet提出之后，FaceBook公司迅速跟进，在2014年构建了一个DeepFace的卷积神经网络。训练数据库包含4000人、400万张人脸，该模型在LFW数据集上取得了97.25%的平均精度，同时在Youtube数据集上取得了当前最好的结果，比之前的第一整整高出了12.7%。

在这里插入图片描述

图1 DeepFace

2015年，香港中文大学唐晓鸥老师实验室研发了DeepID卷积神经网络，这一系统在LFW (Labeled Faces in the Wild)数据库上获得了99.15%的人脸辨识率，超过了人用肉眼在LFW上的辨识率97.52%。这也是第一个声称表现超过人的人脸识别系统。

在这里插入图片描述

图2 DeepID

以近年来领域的发展和经验讲解如何构建实用的人脸识别系统。首先需要注意的是卷积神经网络提取的特征，例如在上图2中，在卷积神经网络的倒数第二层输出是一个160维的向量，而最后一层SoftMax输出的维度是类别数，一般来说我们采用的大型人脸识别数据库类别数都是上万甚至上十万。

例如常用的WebFace数据库，总共有10575个人，也就是10705类。所以，最后一个SoftMax的输出是10575维。由于测试时如此巨大的维度很冗余，对此采取一个折中的方案，在训练的时候保留最后一层SoftMax，而在测试的时候却不要最后一层，将倒数第二层160个维度作为最后人脸识别的特征。在测试时，每张人脸通过卷积神经网络，获得160维向量，利用距离量度，如欧氏距离和余弦距离等，算出基于这160维向量的人脸距离，最终通过阈值获得识别结果。当然，倒数第二层也可以不是160维，适当维数即可。