论文
地址:https://arxiv.org/pdf/1708.02002.pdf
思想
论文最主要的贡献是提出了一个loss函数:Focal loss。主要目的是解决易分类样本和难分类样本之间的均衡问题,不仅仅是解决样本不均衡(数量上)的问题。也就是说使易分类样本对loss的贡献减小,使难分类样本对loss的贡献增大。问题来了,在目标检测中的主要问题是样本不均衡的问题,背景样本太多,而正样本太少,在文中却用Focal loss来解决这个问题,为什么呢?主要原因是,大多数的背景样本都是属于简单易分的样本,只有少数的正样本和背景样本分类难度较大,而那些简单易分的背景样本不应该对梯度下降的方向有太多贡献。在这里正好可以使用Focal loss来解决这个问题。
- Focal loss 是在交叉熵的基础上进行的改进,在损失函数之前增加了一项 ( 1 − p t ) r (1-p_t)^r (1−pt)r.这一项用来调整不同概率样本对loss的贡献的大小。当 p t p_t pt较大的时候这一项就较小,也就是说,容易分类的样本的权重较小;当 p t p_t pt较小的时候这一项就较大,也就是说,难分类的样本的权重较大。