imbalanced_learn包的使用小记

最新推荐文章于 2024-08-09 07:16:03 发布

OverTheMoon

最新推荐文章于 2024-08-09 07:16:03 发布

阅读量6.2k

点赞数

本文链接：https://blog.csdn.net/qq_17377865/article/details/78683531

版权

文档在此

http://contrib.scikit-learn.org/imbalanced-learn/stable/

这一次是使用了under-sampling。样本比例大约200：1

# Resampled
from imblearn.under_sampling import RandomUnderSampler
rus = RandomUnderSampler(random_state = 3)
x_resampled, y_resampled = rus.fit_sample(x_data, y_data)

直接从大样本中随机一定的样本，和小样本混合。

如果需要按照一定比例抽取样本（比如10:1），可以这样：

from imblearn.under_sampling import RandomUnderSampler
rus = RandomUnderSampler(random_state = 3, ratio = {1:5229, 0:52290})
x_resampled, y_resampled = rus.fit_sample(x_data, y_data)

但是在某些版本里ratio不可以是dict，但可以这样：ratio = 0.1