如何理解Focal Loss

论文链接:https://arxiv.org/abs/1708.02002

  1. 动机
    为了解决目标检测中正负样本比例严重失衡的问题,且能更关注于困难样本的学习,使得模型效果更鲁棒。

  2. 从二分类交叉熵损失函数说起
    在这里插入图片描述
    其中y’是经过激活函数后的输出值,常用激活函数sigmoid,故值范围为(0,1)
    分析损失函数,若是正样本,输出概率越大,损失越小;若是负样本,输出概率越小损失越小,但函数默认完全均匀同分布效果最佳,现实样本往往达不到。

  3. Focal Loss
    在这里插入图片描述
    分析第一个因子γ,作用是减少简单样本的损失,增加困难样本的损失权重,使得训练更加注重于困难样本。
    若是正样本,预测值y’为0.9时,经过γ次方,损失会降得特别小。而反过来,若本身是正样本而预测值只有0.3,经过γ次方后损失就会大很多。
    若是负样本,预测值接近于0的比预测值远离0的损失函数数值也会增大很多。
    在这里插入图片描述
    分析第二个因子α,所谓的平衡因子,为了平衡样本之间的比例不均问题。
    在这里插入图片描述

  4. 结论
    作者在做了一系列实验之后,α取值0.25 γ取值2时效果较好,每个网络可以自己尝试选择不同的超参数,应用于样本不均且难易程度不同样本的学习训练中。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值