Focal loss详解与分析

原创已于 2022-09-07 18:12:25 修改 · 1.2k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #人工智能

于 2022-09-06 09:06:26 首次发布

深度学习各项知识整理专栏收录该内容

16 篇文章

订阅专栏

Focal Loss由何凯明提出，旨在解决one-stage目标检测中因样本类别不均衡导致的准确性问题。它通过调整交叉熵损失，降低易分类样本权重，增加难分类样本权重，以优化模型训练。实验表明，γ参数的最佳取值为2，α通常取0.25，以实现更好的效果。Focal Loss成功地提升了one-stage算法的性能，使其接近two-stage的准确度。

目录

一、为什么提出Focal loss

二、Focal loss公式进化过程

三、Focal loss后话

四、Reference

一、为什么提出Focal loss

Focal loss最先是由何凯明在RetinaNet里提出的。

初衷：他想让one-stage检测算法达到two-stage的准确度，同时不影响原有速度。

为什么一阶段不如二阶段准确？，作者认为是样本类别不均衡导致的。在样本集中简单负样本太多，占据了Loss的绝大部分，因此使得模型优化的方向并不是我们希望的那样。

怎么解决？之前有人提出过OHEM来解决类别不均衡问题，但它只增加了难分类样本的权重，却忽略了易分类的样本权重，而作者提出的Focal loss则都考虑了。

二、Focal loss公式进化过程

最开始的损失是交叉熵损失，它各个样本的损失权重是一样的。

下面是他的简写。pt表示分类正确的概率。

这里我们引入一个交叉熵的改进版。

他的at和pt的定义一样。因此可以通过设定a的值来控制正负样本对总的loss的共享权重

但是公式3虽然可以控制正负样本权重，却无法控制难易样本权重。所以就有了Focal loss

调制系数 γ是用来降低易分类样本权重，增加难分类样本权重的。

三、Focal loss后话

按道理来说， $\alpha$ 大于0.5小于1可以增加正样本的权重，降低负样本的权重， $\gamma$ 大于1可以增加难样本权重，减少易分类样本权重。而在实验中证明， $\gamma$ 占据主导地位，当 $\gamma$ 变大时， $\alpha$ 需要变小才能让效果更好。所以最后实验最佳 $\gamma$ 取2， $\alpha$ 取0.25最好。

四、Reference

Focal loss原理解析_zsffuture的博客-CSDN博客_focalloss

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

CVplayer111 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。