smote 采样

最新推荐文章于 2024-06-02 21:08:15 发布

yisun123456

最新推荐文章于 2024-06-02 21:08:15 发布

阅读量1.6k

点赞数

分类专栏： python tensorflow 文章标签：机器学习深度学习 sklearn

本文链接：https://blog.csdn.net/yisun123456/article/details/119029198

版权

python 同时被 2 个专栏收录

13 篇文章 0 订阅

订阅专栏

tensorflow

5 篇文章 0 订阅

订阅专栏

对于正负样本严重不平衡的训练集，可以采用下面的办法进行采样

# 使用sklearn的make_classification生成不平衡数据样本
from sklearn.datasets import make_classification
# 生成一组0和1比例为9比1的样本，X为特征，y为对应的标签
X, y = make_classification(n_classes=2, class_sep=2,
weights=[0.9, 0.1], n_informative=3,
n_redundant=1, flip_y=0,
n_features=20, n_clusters_per_class=1,
n_samples=1000, random_state=10)

from collections import Counter
# 查看所生成的样本类别分布，0和1样本比例9比1，属于类别不平衡数据
print(Counter(y))
# Counter({0: 900, 1: 100})

# 使用imlbearn库中上采样方法中的SMOTE接口
from imblearn.over_sampling import SMOTE
# 定义SMOTE模型，random_state相当于随机数种子的作用
smo = SMOTE(random_state=42)#
X_smo, y_smo = smo.fit_sample(X, y)
print(Counter(y_smo))
#Counter({0: 900, 1: 900})

# 正负样本1：2
smo = SMOTE(sampling_strategy=0.5,random_state=42)
X_smo, y_smo = smo.fit_sample(X, y)
print(Counter(y_smo))
#Counter({0: 900, 1: 450})

yisun123456

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
smote 采样

对于正负样本严重不平衡的训练集，可以采用下面的办法进行采样# 使用sklearn的make_classification生成不平衡数据样本from sklearn.datasets import make_classification# 生成一组0和1比例为9比1的样本，X为特征，y为对应的标签X, y = make_classification(n_classes=2, class_sep=2, weights=[0.9, 0.1], n_i...
复制链接

扫一扫