[损失设计]4.Center Loss

最新推荐文章于 2023-03-13 12:19:58 发布

呼啦圈正在输入中...

最新推荐文章于 2023-03-13 12:19:58 发布

阅读量426

点赞数

本文链接：https://blog.csdn.net/weixin_45745378/article/details/112789061

版权

超强辅助Center Loss

$L_s=-\sum_{i=1}^m\log\frac{e^{W^T_{y_i}x_i+b_{y_i}}}{\sum_{j=1}^{n}e^{W^{T}_{j}x_i+b_j}}+\frac{λ}{2}\sum_{i=1}^{m}||x_i-c_{y_i}||^2_2\tag{4}$

softmax loss使类间距越来越大，Center Loss使类内距越来越小
只使用centerloss效果不好，所以一般是将centerloss与softmaxloss一起使用，引入参数lambda用来平衡两个损失的比例。在模型的训练中，提取出来的特征的区分度越高。λ=0.003和α=0.5时对人脸识别的效果最好
效果
训练技巧：MNSIT数据集，要使用SGD优化器，效果比较好。

是一个辅助函数，单独使用效果不好
类别比较多时，对硬件的要求较高。
原因：由于Centerloss为每个类别需要保留一个类别的中心，当类别的熟练很多(>1000)时，这个内存消耗的非常大，它对GPU的内存要求更高
L2范数的离群点对loss的影响较大
原因：由于centerloss是基于L2范数约束的损失函数，如果某个类别的某个离群点较远，会导致损失下降困难，同样由于损失计算的方差和均值和，即使整体损失下降，个别的利群点仍然离中心很远。
类内距太大，MNIST数据实验中可以看到，每一类特征占据的空间较大，如果类别过多，就无法清除的区分每个类别。
只适合同类样本差异不大的数据，由于一个trick不一定适合所有场景，一般来说，如果同一类样本相似，如MNIST手写数字，人脸数据，那么centerloss往往能够带来效果提升，而如果本身同一类养而不能就差异很大，如cifar100，那么则不一定。可以理解成一个人的一堆脸取平均值仍然是他的脸，而一堆不同的狗平均值则可能难以认出是什么。