[imblearn]-欠采样模型合集

不吃黑巧克力也能活

已于 2022-06-01 23:03:18 修改

阅读量656

点赞数

分类专栏： Imblearn 文章标签： python 机器学习深度学习

于 2022-05-27 18:17:08 首次发布

本文链接：https://blog.csdn.net/weixin_45794390/article/details/125008931

版权

Imblearn 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

官方文档: (Version 0.9.0)Imblearn-API文档
这里记录一下imblearn库中的一些模型使用方法，有空填坑。

一、NearMiss

1.1 使用方法：

# 导入包
from imblearn.under_sampling import NearMiss

nm1 = NearMiss(version=1)  # version可选[1、2、3],分别对应不同的欠采样方法
X_resampled_nm1, y_resampled = nm1.fit_resample(X, y) # X对应特征，y对应标签

1.2 示例：

1.2.1 代码

import pandas as pd
from imblearn.under_sampling import NearMiss

# 准备数据（一个二分类的不平衡数据集多数类30个、少数类20个，随便构造的）
dataPath = "D:\Resource\Desktop\data.csv"
labelPath = "D:\Resource\Desktop\label.csv"
X = pd.read_csv(dataPath, header=None)
y = pd.read_csv(labelPath, header=None)

nm1 = NearMiss(version=1)
X_resampled_nm1, y_resampled = nm1.fit_resample(X, y) # 对多数类进行欠采样（二分类里面的多的那个会去掉一部分）

# 输出结果

print("原始数据集标签：\n标签\t数量")
print(y.value_counts())
print("\n下采样后数据集标签：\n标签\t数量")
print(y_resampled.value_counts())

1.2.2 结果

1.3 附

数据集如下：
蓝奏云

密码：5a6w

不吃黑巧克力也能活

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
[imblearn]-欠采样模型合集

官方文档: (Version 0.9.0)Imblearn-API文档这里记录一下imblearn库中的一些模型使用方法，有空填坑。一、NearMiss1.1 使用方法：# 导入包from imblearn.under_sampling import NearMissnm1 = NearMiss(version=1) # version可选[1、2、3],分别对应不同的欠采样方法X_resampled_nm1, y_resampled = nm1.fit_resample(X, y) #
复制链接

扫一扫