如何通过Focal loss解决目标检测中样本不平衡问题

最新推荐文章于 2023-06-11 19:32:49 发布

ustczhng2012

最新推荐文章于 2023-06-11 19:32:49 发布

阅读量1.7k

点赞数 1

分类专栏：深度学习相关博文文章标签： Focal loss 类别不平衡

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ustczhng2012/article/details/109029886

版权

深度学习相关博文专栏收录该内容

40 篇文章 6 订阅

订阅专栏

一般one stage目标检测模型存在正负样本数量不均衡问题，基于此Focal Loss for Dense Object Detection一文提出Focal loss计算方法用于解决正负样本不平衡问题。

一句话总结：根据置信度结果动态调整交叉熵损失解决类别不平衡问题（当预测正确的置信度增加时，loss的权重系数会逐渐衰减至0，这样模型训练的loss更关注难例，而大量容易的例子其loss贡献很低）

损失函数形式

首先回顾二分类交叉熵损失：

普通的交叉熵损失对于负样本而言，在输出概率较小时，损失还不够小（同理对于正样本而言，在输出概率较大时，损失也还不够小）。这样的损失函数在大量简单样本的迭代过程中比较缓慢且可能无法优化至最优。

Focal loss对此做了改进，其损失函数如下：

（1）在原有的基础上加了一个gamma因子，用于解决难易样本不平衡问题，其中gamma>0使得易分类样本的损失进一步降低，让模型训练更关注于困难的、错分的样本。（例如gamma为2，对于正类样本而言，预测结果为0.95肯定是简单样本，所以（1-0.95）的gamma次方就会很小，这时损失函数值就变得更小。而预测概率为0.3的样本其损失相对很大。对于负类样本而言同样，预测0.1的结果应当远比预测0.7的样本损失值要小得多。对于预测概率为0.5时，损失只减少了0.25倍，所以更加关注于这种难以区分的样本。这样减少了简单样本的影响，大量预测概率很小的样本叠加起来后的效应才可能比较有效。）

（2）加入平衡因子alpha，用来平衡正负样本本身的比例不均：文中alpha取0.25，即正样本要比负样本占比小，这是因为负例易分。

（3）只添加alpha虽然可以平衡正负样本的重要性，但是无法解决简单与困难样本的问题。

（4）gamma调节简单样本损失降低的速率，当gamma为0时即为交叉熵损失函数，当gamma增加时，调整因子的影响也在增加。实验发现gamma为2是最优。

（5）模型的专注度：正难 > 负难 > 正易 > 负易。

参考链接：https://zhuanlan.zhihu.com/p/80594704 https://www.cnblogs.com/king-lps/p/9497836.html

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
如何通过Focal loss解决目标检测中样本不平衡问题

一般one stage目标检测模型存在正负样本数量不均衡问题，基于此Focal Loss for Dense Object Detection一文提出Focal loss计算方法用于解决样本不平衡问题。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。