softmax函数_人脸识别：损失函数总结

weixin_39884144

于 2020-11-23 12:56:52 发布

阅读量176

点赞数

文章标签： softmax函数

Center Loss（ECCV2016）

论文地址：

http://ydwen.github.io/papers/WenECCV16.pdfydwen.github.io

首先在每一个类别学习一个类中心（一个和特征同一个维度的向量）,在训练过程，我们同事更新这个类中心，并最小化深度特征和对应类中心的距离。作者在论文中使用了softmax loss和center loss联合训练，并设置一个超参数用于平衡两者，以获得一个更加鲁棒的模型。

损失函数为：

其中m为batch_size的大小，

为设定的类中心，每次读取一个batch会随机设定类中心

L-Softmax Loss (ICML 2016)

论文地址：

http://proceedings.mlr.press/v48/liud16.pdfproceedings.mlr.press

最初是的Softmax使得

,就是

，但是我们想要使这个约束条件更加严格一些，于是加入一个正整数m用来进行进一步的约束，即

其中

, 根据这个思想我们得到了最终的L-Softmax函数：

其中

的定义如下：

我们可以对比一下L-Softmax和原来Softmax的区别：

为了方便进行反向传播，论文对

进行了重构，即

为了可以正常的正向传播和反向传播，我们使用

来代替

,然后使

上面的公式就是倍角公式的一种？神奇的数学，哈哈！至于如何求偏导那就看论文吧！

A-Softmax Loss (CVPR2017)

论文地址：

SphereFace: Deep Hypersphere Embedding for Face Recognitionarxiv.org

首先我们再次来看原始的Softmax函数，其方程为：SphereFace: Deep Hypersphere Embedding for Face Recognition首先我们再次来看原始的Softmax函数，其方程为：

其中

为向量

之间的角度，然后我们令

这样我们就得到了修改后的softmax函数，即

接着我们再加入上一个L-Softmax的决策边界，使得类间更加分得开，这样就可以得到A-Softmax Loss，其决策边界为：

由于L-Softmax会同时从角度和权重长度上区分不同类别，而A-Softmax将权重进行归一化，并使bias为零，只从角度上去区别不同类别！

AM-Softmax Loss (IPSL 2018)

论文地址：

Additive Margin Softmax for Face Verificationarxiv.org

在这里，我们把全连接层的输入

和权重

全部进行归一化处理，然后令其

，为了使决策分类更加分离，可以增大超球面的体积，即调整超参数s。Additive Margin Softmax for Face Verification在这里，我们把全连接层的输入

和权重

全部进行归一化处理，然后令其

，为了使决策分类更加分离，可以增大超球面的体积，即调整超参数s。

与A-Softmax相比，仅仅把原来的

变成

，这两者的区别就是一个是角度距离，另一个是余弦距离。最终的决策边界是和余弦相关的，根据cos的性质，优化角度距离比优化余弦距离更有效果，因为余弦距离相对更密集！

ArcFace (CVPR2019)

论文地址：

ArcFace: Additive Angular Margin Loss for Deep Face Recognitionarxiv.org

ArcFace这个网络模型，很早就已经关注了，近几天去查了一下，已经被CVPR2019收录，看到人脸识别的各大榜单，基本上都是基于Arcface来进行的，作者认为角度余量比余弦余量更加重要，所以对AM-Softmax进行了改进，得到如下loss函数：ArcFace: Additive Angular Margin Loss for Deep Face RecognitionArcFace这个网络模型，很早就已经关注了，近几天去查了一下，已经被CVPR2019收录，看到人脸识别的各大榜单，基本上都是基于Arcface来进行的，作者认为角度余量比余弦余量更加重要，所以对AM-Softmax进行了改进，得到如下loss函数：

本质上只是把AM-Softmax中的

变成了

，使得其只关注角度信息，下面给出决策边界对比

精度比较

参考链接

【1】https://blog.csdn.net/Fire_Light_/article/details/79599020

【2】Slumbers：人脸识别损失函数综述（附开源实现）

weixin_39884144

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
softmax函数_人脸识别：损失函数总结

Center Loss（ECCV2016）论文地址：http://ydwen.github.io/papers/WenECCV16.pdfydwen.github.io首先在每一个类别学习一个类中心（一个和特征同一个维度的向量）,在训练过程，我们同事更新这个类中心，并最小化深度特征和对应类中心的距离。作者在论文中使用了softmax loss和center loss联合训练，并设置一个超参数用于...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。