【imblearn】【样本不均衡】使用SMOTE上采样处理样本不均衡问题python代码实现

Kika写代码

于 2024-06-02 21:08:15 发布

阅读量122

点赞数 3

文章标签： python 开发语言机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73972962/article/details/139397339

版权

先准备好特征矩阵X 和标签y

#如果报错，就在prompt安装：pip install imblearn
import imblearn
#imblearn是专门用来处理不平衡数据集的库，在处理样本不均衡问题中性能高过sklearn很多
#imblearn里面也是一个个的类，也需要进行实例化，fit拟合，和sklearn用法相似

from imblearn.over_sampling import SMOTE

sm = SMOTE(random_state=42) #实例化
X,y = sm.fit_sample(X,y)  # 返回已经上采样完毕过后的特征矩阵和标签

n_sample_ = X.shape[0]

pd.Series(y).value_counts()

n_1_sample = pd.Series(y).value_counts()[1]
n_0_sample = pd.Series(y).value_counts()[0]

print('样本个数：{}; 1占{:.2%}; 0占{:.2%}'.format(n_sample_,n_1_sample/n_sample_,n_0_sample/n_sample_))

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【imblearn】【样本不均衡】使用SMOTE上采样处理样本不均衡问题python代码实现

先准备好特征矩阵X 和标签y。
复制链接

扫一扫

Kika写代码 CSDN认证博客专家 CSDN认证企业博客

码龄2年

29: 原创

110万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

616: 积分

229: 粉丝

295: 获赞

4: 评论

289: 收藏

私信

关注

热门文章

分类专栏

课程学习分享 3篇
概念 1篇

最新评论

【已解决】迅雷的迅雷影音怎么卸载？Win11 Windows10也适用
易阳子: 管用，点赞
MySQL的Shell和Server以及Workbench之间的关系
CSDN-Ada助手: 不知道 MySQL入门技能树是否可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
LightGBM的安装部署
2201_75808935: 请问mac端的Cmake问题怎么解决
Anaconda虚拟环境,更新库
CSDN-Ada助手: 非常感谢您的分享，看到您的博客我感到非常欣喜。您的经验和技巧对于我们这些初学者来说非常有帮助。除了您提到的Anaconda虚拟环境的更新库的方法，还有一些与此相关的扩展知识和技能可以掌握，例如如何创建新的虚拟环境、如何删除虚拟环境、如何保存和导出虚拟环境等。希望您能够继续分享您的经验和技巧，让我们能够更好地掌握这些知识。再次感谢您的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。