支持向量机（SVM）基础教程

凭栏落花侧

于 2024-10-06 23:19:48 发布

阅读量403

点赞数 14

文章标签：支持向量机机器学习人工智能

本文链接：https://blog.csdn.net/m0_67484548/article/details/142665378

版权

一、引言

支持向量机（Support Vector Machine，简称SVM）是一种高效的监督学习算法，广泛应用

于分类和回归分析。SVM以其强大的泛化能力、简洁的数学形式和优秀的分类效果而备受机器学

习领域的青睐。

二、SVM基本原理

2.1 最大间隔分类器

SVM的核心目标是寻找一个最优的超平面，该超平面能够将不同类别的样本尽可能完美地分

开，并且最大化分类间隔。分类间隔是指超平面到最近的数据点的距离，这个距离越大，模型的泛

化能力通常越强。

2.2 函数间隔与几何间隔

函数间隔：一个标量，表示超平面正确分类样本的程度。

函数间隔越大，表示分类器的信心越强。

几何间隔：函数间隔的归一化形式，考虑了超平面的法向量。

几何间隔更直观地反映了数据点到超平面的实际距离。

2.3 支持向量

支持向量是那些位于分类间隔边缘的数据点。

在最优超平面确定后，只有支持向量对超平面的位置有影响，而其他数据点则不会影响超平

面的位置。

三、SVM算法步骤

3.1 数据预处理

在应用SVM之前，通常需要对数据进行预处理，包括特征缩放、去除缺失值、异常值处理

等，以确保算法的性能不受数据尺度的影响。

3.2 构建优化问题

SVM的优化问题可以表述为

3.3 求解优化问题

3.4 计算超平面参数

3.5 构建分类器

四、SVM应用实例

下面是一个使用Python和scikit-learn库实现SVM分类器的示例。

4.1 导入数据

import numpy as np

import matplotlib.pyplot as plt

from sklearn import datasets

# 导入数据集

X, y = datasets.make_blobs(n_samples=50, centers=2, random_state=6)

4.2 训练SVM模型

from sklearn.svm import SVC

from sklearn.preprocessing import StandardScaler

# 数据归一化

scaler = StandardScaler()

X_scaled = scaler.fit_transform(X)

# 创建SVM模型

clf = SVC(kernel='linear', C=1.0)

# 训练模型

clf.fit(X_scaled, y)

4.3 可视化分类结果

# 绘制数据点

plt.scatter(X_scaled[:, 0], X_scaled[:, 1], c=y, cmap=plt.cm.Paired,

edgecolors='k')

# 绘制超平面

ax = plt.gca()

xlim = ax.get_xlim()

ylim = ax.get_ylim()

xx = np.linspace(xlim[0], xlim[1], 30)

yy = np.linspace(ylim[0], ylim[1], 30)

YY, XX = np.meshgrid(yy, xx)

xy = np.vstack([XX.ravel(), YY.ravel()]).T

Z = clf.decision_function(xy).reshape(XX.shape)

ax.contour(XX, YY, Z, colors='k', levels=[-1, 0, 1], alpha=0.5, linestyles=['--', '-', '--'])

# 绘制支持向量

ax.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], s=100,

           facecolors='none', edgecolors='k')

plt.title('SVM with Linear Kernel')


plt.show()

4.4 结果分析

运行上述代码，我们可以得到如下分类结果图：