支持向量机（SVM）原理，Python 代码

最新推荐文章于 2024-03-20 08:58:52 发布

心态与习惯

最新推荐文章于 2024-03-20 08:58:52 发布

阅读量1.8k

点赞数 4

分类专栏： Python 数学优化统计学/机器学习文章标签： svm 支持向量机 python

本文链接：https://blog.csdn.net/robert_chen1988/article/details/107763167

版权

数学优化同时被 3 个专栏收录

131 篇文章 176 订阅

订阅专栏

Python

58 篇文章 31 订阅

订阅专栏

统计学/机器学习

54 篇文章 34 订阅

订阅专栏

大约从硕士阶段就听说过 SVM 了，但是没有真正用过，这几天刚好看了看相关的内容，就简单写一下心得，供以后查阅用。

支持向量机是一个二分分类方法，比较适合判断只有两个类别的分类问题，对于多类别的分类，需要对 SVM 的部分代码进行修改。

从几何意义上看，SVM 的基本思想是找到一个分类的直线（或平面，或者非线性曲线或平面），将两个类别的数据分开。（两条平行线的距离： $w x = a$ , $w x = b$ ，距离为 $\frac{|b-a|}{\|w\|_2}$ ）

在这里插入图片描述
在数学原理上，优化目标是让中间的分割线离两类数据边缘的距离最大。构建一个数学优化模型，并利用拉格朗日对偶模型求解，具体可以参考这篇博客，比英文维基百科介绍地都清楚：

https://blog.csdn.net/BIT_666/article/details/79865225

Python 中的 Sklearn 包有现成的 SVM 模型可以调用，下面的代码利用 SVM对乳腺癌判别分析，来源于《Python 数据分析与应用》：

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC

cancer = datasets.load_breast_cancer()
cancer_data =  cancer['data']
cancer_target = cancer['target']

cancer_data_train, cancer_data_test, cancer_target_train, \
    cancer_target_test = train_test_split(cancer_data, cancer_target, test_size = 0.2)
    
# 数据标准化
stdScaler = StandardScaler().fit(cancer_data_train)
cancer_trainStd = stdScaler.transform(cancer_data_train)
cancer_testStd = stdScaler.transform(cancer_data_test)

# 建立 SVM 模型
svm = SVC().fit(cancer_trainStd, cancer_target_train)
print('建立的SVM模型为： \n', svm)

# 预测训练集结果
cancer_target_pred = svm.predict(cancer_testStd)
print('预测前20个结果为：\n', cancer_target_pred[:20])

# 预测和真实一样的数目
print('预测对的结果数目为：' , np.sum(cancer_target_pred == cancer_target_test))

输出结果：

建立的SVM模型为：
SVC(C=1.0, break_ties=False, cache_size=200, class_weight=None, coef0=0.0,
decision_function_shape=‘ovr’, degree=3, gamma=‘scale’, kernel=‘rbf’,
max_iter=-1, probability=False, random_state=None, shrinking=True,
tol=0.001, verbose=False)

预测前20个结果为：
[1 1 1 0 0 1 1 0 0 0 1 1 0 1 1 0 1 0 1 1]

预测对的结果数目为： 113

心态与习惯

关注

4
点赞
踩
36

收藏

觉得还不错? 一键收藏
打赏
0
评论
支持向量机（SVM）原理，Python 代码

大约从硕士阶段就听说过 SVM 了，但是没有真正用过，这几天刚好看了看相关的内容，就简单写一下心得，供以后查阅用。支持向量机是一个二分分类方法，比较适合判断只有两个类别的分类问题。从几何意义上看，SVM 的基本思想是找到一个分类的直线（或平面，或者非线性曲线或平面），将两个类别的数据分开。在数学原理上，优化目标是让中间的分割线离两类数据边缘的距离最大。构建一个数学优化模型，并利用拉格朗日对偶模型求解，具体可以参考这篇博客，比英文维基百科介绍地都清楚：https://blog.csdn.net/BIT
复制链接

扫一扫