focal loss详解

작은 여우

已于 2023-05-28 19:38:43 修改

阅读量1.7k

点赞数 4

分类专栏： # 编程语言文章标签：机器学习深度学习算法

于 2022-09-09 23:59:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yhsunhfut/article/details/126791496

版权

编程语言专栏收录该内容

4 篇文章 0 订阅

订阅专栏

focal loss详解

focal loss 是一种处理样本分类不均衡的损失函数，它能够根据分辨样本的难易程度区分样本，给样本不用的损失权重，即容易区分的样本添加较小的权重 $\alpha_1$ ，给难分辨的样本添加较大的权重 $\alpha_2$ 。
- 分类置信度接近1或者0的样本称为易分辨样本
- 其余称之为难于分辨的样本
损失函数的定义如下，将损失函数的重点集中在难分辨的样本上
$L_{sum} = \alpha_1\times L_{易区分}+ \alpha_2\times L_{难区分}$
focal loss的出现过程
- 标准交叉熵损失，以二分类为例
  $CE(p,y)=\begin{cases}-log(p)&if \quad y=1\\-lpg(1-p)& otherwise\end{cases}$
  - 为统一 $p$ 、 $1 - p$ ，我们设置 $p_t$ 函数：
    $p_t=\begin{cases}p &if \quad y=1\\1-p& otherwise\end{cases}$
  - 可以得到 $CE(p,y)=CE(p_t)=-log(p_t)$
  - 这种损失函数在处理类不平均衡时非常糟糕，会因为某类的冗余，而主导损失函数，使模型失去效果。
- 为了解决类不平衡问题，常见的做法是添加权重因子，即平衡交叉熵。在 $\alpha\in[0,1]$ 的前提下，对类别1添加 $a lp ha$ ，对类别-1添加 $1-\alpha$ 。为了形式上的方便，我们采用 $a_t$ ，从而可以得 $CE(p_t)=-a_tlog(p_t)$ 。但是，当我们处理大量负样本、少量正样本的情况时，即使我们把负样本的权重设置很低，但是因为负样本的数量太大，积少成多，负样本的损失函数也会主导损失函数。
- 那些即使置信度很高的样本在标准交叉熵里也会存在损失。置信度很高的负样本往往占总样本的绝大部分，如果将这部分损失去除或者减弱，那么损失函数的效率会更高。
  - 作者想减少置信度很高的样本损失在总损失中的比重，即在标准交叉熵前添加了权重因子 $(1-p_t)^\gamma$ ，形成focal loss：
    - $FL(p_t)=-(1-p_t)^\gamma log(p_t)$
  - 之前提到了解决类不平衡的平衡交叉熵，那么将平衡交叉熵和focal loss 两者混合就可以得到focal loss的 $\alpha$ 变体，如下，这个损失函数不仅考虑吧了"容易分辨"，还考虑了“正负样本”的问题，在处理类不均衡的问题上，可以发挥巨大的作用。
    - $FL(p_t)=-\alpha_t(1-p_t)^\gamma log(p_t)$
    - $FL(p)=\begin{cases}-\alpha(1-p)^\gamma log(p) &if \quad y=1\\ -(1-\alpha)p^\gamma log(1-p) & otherwise\end{cases}$
      -不同的参数，需要仔细调参，褒贬不一
  - Focal loss与CE损失对比，易受噪音干扰

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。