【深度学习】Focal Loss

最新推荐文章于 2023-07-15 11:04:31 发布

聊北辰同学

最新推荐文章于 2023-07-15 11:04:31 发布

阅读量268

点赞数 2

分类专栏：基础文章标签：神经网络深度学习 1024程序员节

本文链接：https://blog.csdn.net/weixin_43363778/article/details/108413251

版权

6 篇文章 0 订阅

订阅专栏

背景

one-stage目标检测任务中存在正负样本严重不均衡和难易样本不均衡的问题
实际情况下，易分样本占比高，他们产生的损失会主导模型的损失。而很多情况下，难分样本的区分也同样非常重要。当易分样本或头部样本的损失占主导时，模型参数的更新很难对难分样本或尾部样本具有很好的泛化能力。

解决思路

正常的交叉熵损失

$\left\{ \begin{aligned} -log(p) && y = 1 \\ -log(1-p) && y=0 \end{aligned} \right.$

Focal Loss

$FocalLoss=\left\{ \begin{aligned} -\alpha(1-p)^{\gamma}log(p) && y = 1 \\ -(1-\alpha)p^{\gamma}log(1-p) && y=0 \end{aligned} \right. $

式子中 $\alpha$ 为权重因子， $p$ 为置信度， $\gamma$ 为缩放系数， $y = 1$ 代表正类， $y = 0$ 代表负类。

$\alpha$ 用于平衡类别数量的不平衡
$\gamma$ 用于降低易分样本的损失，一般设置为大于1的数（如2，当预测为正样本的置信度为0.9，那么 $1 - p = 0.1$ ，那么 $(1-p)^{\gamma}=0.1^2=0.01$ ，缩小了十倍，置信度越高，缩小的越多，从而平衡难易样本）

关注

专栏目录