不平衡分类基本策略


类不平衡学习又叫不平衡类、稀有类学习。类不平衡分布特征是一个类的实例数(多数类、负类)明显多于另一类(少数类、正类)。通常,正确分类正类实例比正确分 类 负类实例更有意义。例如,在信用欺诈中监测中,欺诈用户明显少于正常用户,然而,如何正确识别欺诈用户更具实际意义。

 

 传统处理稀有类方法大致:(1)通过抽样的方法的平衡训练数据集;(2)基于算法的方法。对于前者,已经提出了很多行之有效的抽样方法,如随机欠抽样负类实例(under-sample)、随机过抽样正类样本(over-sample)、生成新正类样本的过抽样法等。后者包括两阶段法、代价敏感方法等

转载于:https://www.cnblogs.com/hpblogs/p/4047210.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值