前言
在制作数据集时,标注数据时难免会存在噪声,如不同类别交界处存在模糊导致定位异常问题,训练过程梯度不稳定,网络对这部分数据的分类置信度较低(如其它中心区域的类别置信度都在0.9左右,而类别交界处的置信度只在0.5左右)
一、损失函数方面
(1)t-loss
(2)边缘平滑
边缘平滑的思想来自于分类任务常用的Label Smoothing,又称为标签平滑。标签平滑的思想就是将原本的“硬标签”转换为“软标签”,如下图所示:
那为什么要这样做呢?下面来看一个CE损失
从上图看出,只有 y=1 的维度参与了loss的计算,其它的都忽略了。这样可能会造成一些问题:
- 若标签存在噪声(标注错误),造成的影响会比较大
- 真实标签跟其他标签