- 博客(2)
- 资源 (7)
- 收藏
- 关注
原创 LightGBM处理imbalanced数据集
在用LightGBM做分类器时如何处理样本类别分布不均衡的问题?一个简单的方法是设置is_unbalance参数为True或者设置scale_pos_weight,二者只能选一个。 设置is_unbalance参数为True时会把负样本的权重设为:正样本数/负样本数。这个参数只能用于二分类。参考: 1. LightGBM官方文档:https://github.com/Microsoft...
2018-08-11 14:22:56 16036 4
原创 SMOTE
SMOTE是处理样本类别分布不均衡的数据集的一种算法,它的全称是Synthetic Minority Over-sampling TEchnique。顾名思义就是合成少数类别样本的一种算法。它的灵感来自于做数字识别是对图片进行翻转等操作生成新样本的方法。 下面是它的伪代码: ...
2018-08-11 15:24:53 3929
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人