在用LightGBM做分类器时如何处理样本类别分布不均衡的问题?
一个简单的方法是设置is_unbalance
参数为True
或者设置scale_pos_weight
,二者只能选一个。
设置is_unbalance
参数为True
时会把负样本的权重设为:正样本数/负样本数。这个参数只能用于二分类。
参考:
1. LightGBM官方文档:https://github.com/Microsoft/LightGBM/blob/master/docs/Parameters.rst。
2. https://github.com/Microsoft/LightGBM/issues/332
3. https://github.com/Microsoft/LightGBM/issues/63