【机器学习】基础入门（3）SVM支持向量机及代码实现

最新推荐文章于 2024-06-11 14:16:42 发布

baekii

最新推荐文章于 2024-06-11 14:16:42 发布

阅读量884

点赞数

分类专栏：机器学习文章标签： python 机器学习支持向量机

本文链接：https://blog.csdn.net/qq_36977302/article/details/108229630

版权

机器学习入门（3）SVM

1 支持向量机SVM
2 Demo实践

1 支持向量机SVM

一篇非常好的SVM理论讲解（点这里）

1.1 支持向量机介绍

STEP 1：构建数据集

import matplotlib.pyplot as plt
from sklearn.datasets.samples_generator import make_blobs

# 散点图可视化
X, y = make_blobs(n_samples=60, centers=2, random_state=0, cluster_std=0.4)
plt.scatter(X[:, 0], X[:, 1], c=y, s=60, cmap=plt.cm.Paired)

在这里插入图片描述

make_blobs模块构造数据集
sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)

n_samples: int, optional (default=100)，待生成的样本的总数
n_features: int, optional (default=2)，每个样本的特征数
centers: int or array of shape [n_centers, n_features], optional (default=3)，要生成的样本中心（类别）数，或者是确定的中心点
cluster_std: float or sequence of floats, optional (default=1.0)，每个类别的方差，例如我们希望生成2类数据，其中一类比另一类具有更大的方差，可以将cluster_std设置为[1.0,3.0]

STEP 2：线性分类器

# 画散点图
X, y = make_blobs(n_samples=60, centers=2, random_state=0, cluster_std=0.4)
plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap=plt.cm.Paired)
x_fit = np.linspace(0, 3) #将(0，3)等距离分为50份

# 画函数(可能会有多种分法)
y_1 = 1 * x_fit + 0.8
plt.plot(x_fit, y_1, '-c')

y_2 = -0.3 * x_fit + 3
plt.plot(x_fit, y_2, '-k')

plt.show()

在这里插入图片描述

np.linspace：主要用来创建等差数列
numpy.linspace(start, stop, num, endpoint=True, retstep=False, dtype=None, axis=0)
在start和stop之间返回均匀间隔的数据

start：返回样本数据开始点
stop：返回样本数据结束点
num：生成的样本数据量，默认为50
endpoint：True则包含stop；False则不包含stop
retstep：如果为True则结果会给出数据间隔
dtype：输出数组类型
dtype：输出数组类型

STEP 3：测试新数据分类情况

# 画散点图
X, y = make_blobs(n_samples=60, centers=2, random_state=0, cluster_std=0.4)
plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap=plt.cm.Paired)
# 在散点图上标记新加入的红色节点(3，2.8)为<
plt.scatter([3], [2.8], c='#cccc00', marker='<', s=100, cmap=plt.cm.Paired)
x_fit = np.linspace(0, 3) #将(0，3)等距离分为50份

# 画函数
y_1 = 1 * x_fit + 0.8
plt.plot(x_fit, y_1, '-c')

y_2 = -0.3 * x_fit + 3
plt.plot(x_fit, y_2, '-k')

plt.show()

在这里插入图片描述
可以看到，此时黑色的线会把这个新的数据集分错，蓝色直线分类正确。
However上面这个例子的给出带有主观性，如何客观地评判两种分类方式的健壮性呢？

STEP 4：分类器优劣判断——最大间隔

# 画散点图
X, y = make_blobs(n_samples=60, centers=2, random_state=0, cluster_std=0.4)
plt.scatter(X

最低0.47元/天解锁文章

baekii

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
【机器学习】基础入门（3）SVM支持向量机及代码实现

机器学习入门（3）SVM1 支持向量机SVM1.1 支持向量机介绍1.2 软间隔1.3 超平面2 Demo实践2.1 库函数导入2.2 构建数据集2.3 建模2.4 模型预测2.5 模型可视化1 支持向量机SVM一篇非常好的SVM理论讲解（点这里）1.1 支持向量机介绍STEP 1：构建数据集import matplotlib.pyplot as pltfrom sklearn.datasets.samples_generator import make_blobs# 散点图可视化X, y
复制链接

扫一扫

专栏目录