支持向量机算法-CSDN博客

本文链接：https://blog.csdn.net/weixin_64546620/article/details/133598535

支持向量机(Support Vector Machine,SVM)可以用于分类和回归

概述

本节使用线性支持向量机（Linear Support Vector Machine,LSVM）处理二元分类

线性支持向量机是以间隔最大化为标准，来学习得到尽可能远离数据的决策边界的算法

该算法决策边界与逻辑回归一样是线性的，但有时线性支持向量机效果更好

线性支持向量机的学习方式是：以间隔最大化为标准，让决策边界尽可能地远离数据

算法说明

线性支持向量机通过最大化间隔来获得更好的用于分类的决策边界

间隔：（以平面上二元分类为例，假设数据可以完全分类）线性支持向量机通过线性的决策边界将平面一分为二，据此进行二元分类。此时，训练数据中最接近决策边界的数据与决策边界之间的距离即为间隔

支持向量机试图通过增大决策边界和训练数据之间的间隔来获得更合理的边界

示例代码

代码生成线性可分的数据，将其分割成训练数据和验证数据，使用训练数据训练线性支持向量机，使用验证数据评估正确率

from sklearn.svm import LinearSVC
from sklearn.datasets import make_blobs
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 生成数据
centers = [(-1, -0.125), (0.5, 0.5)]
X, y = make_blobs(n_samples = 50,n_features = 2,centers = centers,cluster_std = 0.3)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3)
model = LinearSVC()
model.fit(X_train, y_train) # 训练
y_pred = model.predict(X_test)
accuracy_score(y_pred, y_test) # 评估