人脸识别-论文阅读-ArcFace及其由来(SphereFace、CosFace)

ArcFace(建议大家去看论文的第一版)是现在最常用的人脸识别算法,它从softmax、SphereFaceCosFace发展过来,这里就详述一下arcface算法和其发展过程。

在这里插入图片描述

图1

ArcFace发展过程

随着深度学习人脸识别的发展,现在人脸识别的主要思想是在网络学习的过程中增大类间差距(inter-class)的同时减小类内差距(intra-class)。

Softmax

Softmax是最常用的分类损失函数:
L = − 1 N ∑ i = 1 N log ⁡ ( e W y i T x i + b y i ∑ j = 1 n e W j T x i + b j ) (1) L = - \frac1N \sum_{i=1}^N\log(\frac{e^{W_{y_i}^Tx_i + b_{y_i}}}{\sum_{j=1}^ne^{W_j^Tx_i + b_j}})\tag{1} L=N1i=1Nlog(j=1neWjTxi+bjeWyiTxi+byi)(1)
其中 x ∈ R d x\in R^d xRd表示第i个样本中真值为yi的深度特征,在常见的人脸识别算法中,x的特征维度一般是512维; W j ∈ R d W_j \in R^d WjRd 是权重 W ∈ R d × n W \in R^{d \times n} WRd×n(通常为FC层)第j个列向量, b j ∈ R n b_j \in R^n bjRn是偏置项;batch size和分类数目分别是N和n;对于第i个类来说,其feature embedding(嵌入特征)即为 W i T x + b i W_i^Tx + b_i WiTx+bi

softmax损失经常运用在较早的人脸识别中,但是它并没有显式地优化feature embeding从而使类间距增大和类内距减小,使得人脸识别结果并不理想。

SphereFace

SphereFace是首个将人脸识别的特征空间转换到超球面角度特征空间的算法。对于(1)式中的feature embedding( W i T x + b i W_i^Tx + b_i WiTx+bi),由向量的乘法可以转换成 ∣ ∣ W i T ∣ ∣ ∣ ∣ x ∣ ∣ cos ⁡ ( θ i ) + b i ||W_i^T||||x||\cos(\theta_i) + b_i WiTxcos(θi)+bi,其中 θ i \theta_i

  • 7
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
人脸识别是指利用计算机视觉技术对图像或视频中的人脸进行自动识别和分析的过程。人脸识别技术主要包括特征检测和人脸匹配两个部分。 特征检测是指从图像中提取出与人脸有关的特征信息,包括人脸的轮廓、眼睛、鼻子、嘴巴等特征点。在特征检测过程中,通常会使用Haar特征分类器、HOG特征分类器或者深度学习卷积神经网络等算法来实现。 人脸匹配是指将提取出来的人脸特征与数据库中已有的人脸特征进行比对,以判断该人脸是否已经被识别过或者是否为指定人员。常见的人脸匹配算法包括欧氏距离匹配算法、余弦相似度匹配算法、支持向量机(SVM)等。 关于利用C++实现人脸识别的代码,可以参考开源库OpenCV中的示例代码,该库提供了丰富的图像处理和计算机视觉功能,包括人脸检测和识别等。以下是一个简单的基于OpenCV的人脸检测和识别的代码示例: ```c++ #include <opencv2/opencv.hpp> #include <opencv2/face.hpp> using namespace cv; using namespace std; using namespace cv::face; int main(int argc, char** argv) { // 加载人脸检测器和识别器 CascadeClassifier face_cascade; face_cascade.load("haarcascade_frontalface_alt.xml"); Ptr<LBPHFaceRecognizer> recognizer = LBPHFaceRecognizer::create(); // 加载训练好的模型 recognizer->read("model.xml"); // 打开摄像头 VideoCapture cap(0); if (!cap.isOpened()) { cout << "无法打开摄像头!" << endl; return -1; } while (true) { Mat frame; cap >> frame; // 转换成灰度图像并进行直方图均衡化 Mat gray; cvtColor(frame, gray, COLOR_BGR2GRAY); equalizeHist(gray, gray); // 检测人脸 vector<Rect> faces; face_cascade.detectMultiScale(gray, faces, 1.1, 2, 0 | CASCADE_SCALE_IMAGE, Size(30, 30)); // 对每个检测到的人脸进行识别 for (size_t i = 0; i < faces.size(); i++) { Mat face = gray(faces[i]); resize(face, face, Size(92, 112)); // 将人脸图像缩放到指定大小 int label = -1; double confidence = 0.0; recognizer->predict(face, label, confidence); // 在图像中标注出人脸位置和识别结果 rectangle(frame, faces[i], Scalar(255, 0, 0), 2); putText(frame, format("Person %d", label), Point(faces[i].x, faces[i].y - 5), FONT_HERSHEY_PLAIN, 1.0, Scalar(0, 255, 0), 2); } imshow("Face Recognition", frame); if (waitKey(30) == 'q') break; } return 0; } ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值