电荷与电势能也和人脸识别有关？——UniformFace论文阅读_uniformface: learning deep equidistributed represe-CSDN博客

本文链接：https://blog.csdn.net/junbaba_/article/details/106622355

UniformFace是一种创新的人脸识别技术，它通过模仿电荷与电势能原理，设计了一个新的损失函数，旨在使特征分布更加均匀，从而提高人脸识别的准确性。该方法在多个数据集上进行了实验，包括MegaFace、IJB-A、YTF和LFW，结果显示UniformFace在特征分布和识别性能上均优于现有方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

电荷与电势能也和人脸识别有关？——UniformFace论文阅读

电荷与电势能也能跟人脸识别有关吗？？？对！！UniformFace的作者就在它们之间建立了联系。今天，我来和大家一起分享一下这篇论文（UniformFace: Learning Deep Equidistributed Representation for Face Recognition ）吧。

Introduction

一般来说，一个实际的人脸识别系统有四个主要步骤：人脸检测、人脸对齐、人脸表示和人脸匹配。在其中，人脸表示（Face Representation）是从不同的人身上提取人脸识别特征的关键。近年来，随着深度学习的快速发展，基于卷积神经网络（CNNs）的人脸表示技术得到了长足的发展。而决定CNN特征识别能力的关键因素有三个，分别是：训练数据、网络结构和损失函数。在这篇文章中，作者主要关注的是第三个方面，也就是如何设计一个更有效的损失函数。

既然讲到损失，我们最常见、最了解的便是多分类问题使用到的Softmax Loss了。Softmax Loss广泛应用于训练CNN特征，它通常被定义为最后一个完全连接层、Softmax函数和交叉熵损失的组合，其表示如下：
$L_s = -\frac1N \sum_{i=1}^{N}log\frac{e^{\boldsymbol{W}^{T}_{y_i}\boldsymbol{x}_i + b_{y_i}}}{\sum_{j=1}^M e^{\boldsymbol{W}^{T}_{j}\boldsymbol{x}_i + b_{j}}}$
而Softmax Loss学习到的特征具有内在的角度分布，这表明余弦距离是度量，因此损失函数又可以写为如下的这种形式:
$L_m = -\frac1N \sum_{i = 1}^Nlog \frac{e^{||\boldsymbol{x}_i||cos(\theta_{y_i,i})}}{\sum_{j=1}^M e^{||\boldsymbol{x}_i||cos(\theta_{j,i})}}$
Sphereface的作者在此基础上进一步改进，在sample point和target class之间的角度乘以了margin参数m，通过A-Softmax损失操纵决策边界以产生角度裕度：
$L_{a-s} = -\frac1N \sum_{i=1}^Nlog \frac{e^{||\boldsymbol{x}_i||\psi(\theta_{y_i,i})}}{e^{||\boldsymbol{x}_i||\psi(\theta_{y_i,i})}+ \sum_{j \neq y_i} e^{||\boldsymbol{x}_i||cos(\theta_{j,i})}}$
其中
$\psi(\theta_{y_i,i}) = (-1)^kcos(m\theta_{y_i,i}) - 2k,\\ \theta_{y_i,i} \in [\frac{k\pi}{m}, \frac{(k+1)\pi}{m}],\\ k \in [0,m-1]$

从图中我们可以看到，与前两者相比，A-Softmax在类别的角度维度上的分类更加分明，决策边界明显扩大。同时，从图中我们也可以看出上文中提到的Softmax内在的角度分布特性。

在这里插入图片描述

Motivation

然而，Sphereface还是存在一定的缺陷。我们在模式识别问题中往往希望最终实现类内距离小，而类间距离大。Sphereface通过A-softmax将同一类的特征约束到了较小的区域，使得类内距离小。但是，它却没有考虑特征在整体超球流形中的分布，也就是类间距离。如下图所示，0、1两个类别间的距离相对较小，也就是特征分布的最小类间距离较小。
在这里插入图片描述

从上面的推演中我们可以想到，最小类间距离可以衡量我们的特征分布到底好不好，最小类间距越大，我们的特征分布应该会更好。那么，我们自然可以联想到：当特征分布均匀时，我们将拥有最大的最小类间距，就像图中所示，显然，这个均匀分布的最小类间距要大于刚刚的Sphereface。因此，作者的目标是能够实现这样的分布，以期在人脸识别问题上取得更好的效果。
在这里插入图片描述

Solution

那么，我们该如何设置损失函数来使得特征分布更加均匀呢？作者这里联想到了电势能——由于不同类的面应该分开，我们认为类中心就像等量的电荷，每个中心排斥其他中心；同时，球体表面的电荷在均匀分布时的势能最小。如图所示，我们可以看做是以电势能为损失函数，通过优化使损失函数达到最小值时，电荷会均匀分布。那么，将电荷替换为类中心时，我们用类似电势能的公式作为损失函数，最终类中心应该能够均匀分布。

在这里插入图片描述

作者受到此启发，也类比了电场力、电势能的公式。其中， $c_{j_1},c_{j_2}$ 表示两个类中心。首先，力与距离的平方成反比：
$\lambda \frac{1}{d(\boldsymbol{c}_{j_1},\boldsymbol{c}_{j_2})^2}$

对力进行距离上的积分，我们得到了能量：
$\int_{d(\boldsymbol{c}_{j_1},\boldsymbol{c}_{j_2})}^{\infty} \lambda \frac{1}{x^2}dx = \lambda \frac{1}{d(\boldsymbol{c}_{j_1},\boldsymbol{c}_{j_2})}$
类比能量，作者写出了Loss函数，命名为Uniform Loss：
$L_u = \frac{\lambda}{M(M-1)}\sum_{j_1=1}^M \sum_{j_1 \neq j_2}\frac{1}{d(\boldsymbol{c}_{j_1},\boldsymbol{c}_{j_2})}$
由于类中心 $c_j$ 在训练过程中不断变化，在每次迭代中我们都要利用整个训练集更新 $c_j$ ，耗时过长，在实际中是不适用的。因此，作者采用了一种改进的方法，在每个mini-batch上更新类中心。
$\Delta \boldsymbol{c}_j = \frac{\sum_{i=1}^{n} \delta(y_i = j)\cdot (\boldsymbol{c}_j-\boldsymbol{x}_i)}{1 + \sum_{i=1}^{n}\delta(y_i = j)}$
最终总体Loss函数设计为A-Softmax Loss和Uniform Loss的结合：
$L = L_{a-s} + L_u$