数据不平衡的分类问题

  • 什么都不做。有时候很幸运,不需要做什么,就可以使用所谓的自然(或分层)分布进行训练。
  • 在数据层面上,以某种方法平衡训练集:
    • 过度采样少数分类。
    • 对多数分类进行抽样。
    • 合成新的少数分类。
    • 抛弃一定少数分类,转而采用异常检测框架。
  • 在算法层面上:
    • 调整样本权重(调整错误分类的损失)。
    • 调整决策阈值。
    • 修改现有算法以对稀有类更敏感。
  • 构建一个全新的算法,从而在不平衡数据上表现良好

参考链接:

https://77qingliu.com/2019/03/03/Learning-from-Imbalanced-Classes/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值