Class-Balanced Loss Based on Effective Number of Samples解决类别不平衡loss

github:https://github.com/vandit15/Class-balanced-loss-pytorch/blob/master/class_balanced_loss.py

本文用于解决样本类别不平衡问题, 尤其是数据是长尾分布的情况. 

本文核心概念为, 有效采样数.En

那么某一类别有效采样数多, 起loss权重应该小, 即和En成反比,

所以类别权重只要乘以En的倒数即可, 可以和各种已有的loss结合, 其中beta为样本的数目, ny为第n次采样数目

核心:怎么得到En

1.某一类别所有数据量为N, 在采样新的数据时, 有可能和已经采样的包含, 也有可能不包含, (为简化, 不考虑相交)如下图, 作者假设有些采样数据, 就是最后采样的体积, 上界为N.

2.作者假设random crop, sclae,等数据增强后的数据等价于原始数据

假设采样了n-1个样本后, 的有效样本数为En-1, 那么第n次采样为包含关系的概率p为En-1/N, 非包含为1-p

那么可得下式:, 再利用数学归纳法可以证明出来, 所以beta=(N-1)/N

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yang_daxia

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值