支持向量机(SVM)不平衡样本处理方法

最新推荐文章于 2024-07-11 14:39:35 发布

weixin_44158517

最新推荐文章于 2024-07-11 14:39:35 发布

阅读量6.6k

点赞数 4

文章标签：支持向量机 SVM 不平衡样本过采样

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44158517/article/details/87900689

版权

本文探讨了支持向量机(SVM)在处理不平衡样本问题上的策略，包括改变分类阈值、调整样本权重、过采样技术如SMOTE。通过实验展示了权重调整和随机过采样如何影响SVM对少数类样本的分类效果，证明了这些方法能有效提升少数类样本的重视程度。

摘要由CSDN通过智能技术生成

支持向量机(SVM)不平衡样本处理方法

在许多机器学习任务中经常出现样本不均衡问题，即某类样本在总样本占比极低。一般解决样本不平衡问题的方法有以下几种：
（1）改变分类阈值，使分类结果更偏向于样本少的一类
（2）改变样本类别的权重
（3）过采样与欠采样（即对多数样本采用欠采样，或对少数样本采用过采样。）
（4）采用数据合成方法进行过采样（SMOTE合成少数类过采样技术）
本文使用支持向量机算法对不平衡样本的处理进行简单验证。本文主要观察改变样本权重以及使用随机过采样对分类结果的影响来判断该方法对少数样本的重视程度。

引入第三方库

import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm

创建不均衡样本

rng = np.random.RandomState(0)
n_samples_1 = 1000
n_samples_2 = 100
X = np.r_[1.5 * rng.randn(n_samples_1, 2), 0.5 * rng.randn(n_samples_2, 2) + [2, 2]]
y = [0] * (n_samples_1) + [1] * (n_samples_2)

使用支持向量机对未处理样本进行拟合分类

clf = svm.SVC(kernel=‘linear’)
clf.fit(

最低0.47元/天解锁文章

weixin_44158517

关注

4
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。