阅读笔记-GICOFACE: GLOBAL INFORMATION-BASED COSINE OPTIMAL LOSS FOR DEEP FACE RECOGNITION-CSDN博客

本文链接：https://blog.csdn.net/m0_53678795/article/details/135166096

GICOFACE: GLOBAL INFORMATION-BASED COSINE OPTIMAL LOSS FOR DEEP FACE RECOGNITION

基于全局信息的余弦最优损失深度人脸识别算法

1、这篇论文要解决什么问题？要验证一个什么科学假设？

问题：首先以往的损失函数或不应用权重和特征归一化，如对比损失、三重损失、中心损失、范围损失和边际损失;或者不明确遵循提高辨别能力的两个目标，如 L-Softmax 损失、A-Softmax 损失、AM-Softmax 损失和 ArcFace；其次，都只考虑当前小批的反馈信息，而不考虑整个训练集的全局信息。

2、这篇论文有哪些相关研究，这些研究是怎么分类的？有哪些研究员值得关注？

3、论文中提到的解决方案是什么，关键点在哪儿？

这篇论文提出了一种新的损失函数，即基于全局信息的余弦最优损失(Global Information-based cos Optimal loss, Gico loss) 。用Gico loss 训练的深度模型叫做 GicoFace。Gico损失具有优化类内和类间方差、权值和特征归一化的所有四个特性。与其他损失不同

的是，Gico损失是由整个训练集的全局信息来引导的。

这篇论文的关键点如下:

提出了一种新的损耗函数来提高深度特征的识别能力。据我们所知，这是同时满足四个特性的第一个损失，也是第一次尝试使用全局信息作为反馈信息。
提出并实现了三个不同版本的 Gico 损失，并分析了它们在多个数据集上的性能变化。

P 为整个训练集中的类数，cj 为 j 类的中心，ej 为 j 类的边(即 j 类的最远样本)。R(j)为 j 类的余弦范围，即类中心与j 类边缘的余弦相似度。在训练过程中，每个小批处理后，深

度特征都在发生变化，这也导致了 cj 和 ej 的变化。

采用保守策略，即将 K的值设为 P，其中P为类数。因为相邻中心对的最小数目是P，当所有类中心在超球表面上排成一个圆时发生。

4、论文中的实验是如何设计的？各个实验分别得到了什么结论？

实验一：将带有不同损耗的 Inception-

ResNet-v1组合成5种不同的组合:(1). ResNet+Softmax、(2).ResNet+ m -Softmax 、(3). ResNet+Gico Lite A 、(4).ResNet+Gico Lite B 、(5). ResNet+Gico Std.在所有的实验中，设置 320 为 epoch size, 120 为 batch size, 5e-4 为 weight decay, 0.4为全连接层保持概率，512为嵌入大小，0.01为收缩速率。手动优化超参数 λ。因为它对性能不是很敏感，所以只是在每个测试集中尝试多个不同的值，并选择导致最佳结果的值。初始学习速率设置为 0.05，每100,000次迭代减少10倍。VGGFace2是实验中的训练数据，将所提出的方法与 LFW、YTF 和SLLFW上的最新方法进行比较：

从表 2可以看出 :Gico Std在LFW上的验证准确率高于Softmax、AM-Softmax、Gico Lite A 和 Gico Lite b。Gico Std与 FaceNet 在 LFW上排名第一。然而，FaceNet 使用 2 亿张图片进行培训，而Gico Std仅使用305万张图片。Gico Std还击败了LFW上的其他基准测试方法，其中大多数都在领先的计算机视觉会议上发表。在 YTF 数据集上，所提出的 Gico损失方法仍然比其他基准方法有更好的性能，展示了Gico损失的最先进的性能。

实验二：LFW是一个流行的人脸数据集。但越来越多的方法逐渐触及其理论上限。因此，在LFW上区分不同的方法变得越来越困难。为了验证所提出方法的性能，在 SLLFW上进行了额外的实验。SLLFW使用与 LFW相同的阳性对进行测试，但在 SLLFW中，通过人类众包从 LFW中刻意挑选出3000 对相似的面孔对来替代 LFW 中随机选取的阴性对。SLLFW给测试增加了更多的挑战，导致同样先进的测试方法的准确度下降了约10-20%。

表 3 给出了 SLLFW上不同方法的验证精度。表的上半部分显示了一些基准方法的结果。这些结果是公开的，由SLLFW团队提供。从表3可以看出，在SLLFW上，Gico损失比其他方法有更好的性能。在表的上半部分，基准方法的准确率从 LFW下降到 SLLFW下降了 16.75%到 4.68%。相比之下，Gico 损失的准确性下降了 1.45% ~ 1.49%。在 SLLFW上的实验结果进一步验证了所提方法的有效性。

5、用于定量评估的数据集是什么？代码开源的话找到链接

LFW、YTF 和SLLFW

6、这篇论文到底有什么贡献？（三句话内说明）新在什么地方？

这篇论文提出了一种新的损失函数——基于全局信息的余弦最优损失(Gico)。Gico 损失综合了近年来人脸识别中提出的最佳损失的优点。Gico 是第一次尝试使用全局信息作为面部识别的反馈。为了使Gico成为可能，文章还提出了一种新的算法来学习类中心和类边缘之间的余弦相似度。在 LFW、SLLFW和YTF 数据集上进行了大量的实验。结果证明了所提出的Gico 的有效性，并表明其达到了最先进的性能。