svm代码实现

最新推荐文章于 2024-07-04 23:13:55 发布

欲扬yyds01

最新推荐文章于 2024-07-04 23:13:55 发布

阅读量795

点赞数

分类专栏： svm 文章标签： svm

本文链接：https://blog.csdn.net/qq_53169429/article/details/119046400

版权

svm 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文深入探讨了支持向量机（SVM）的优势，如在高维空间的有效性、内存效率及通用性，并通过核函数的选择实现非线性分类。同时，指出了SVM的不足，如特征过多可能导致过拟合和概率估计的复杂性。通过示例展示了SVM如何构建最大超平面并进行非线性分类。

摘要由CSDN通过智能技术生成

支持向量机的优点有：

在高维空间里也非常有效
对于数据维度远高于数据样本量的情况也有效
在决策函数中使用训练集的子集(也称为支持向量)，因此也是内存高效利用的。
通用性：可以为决策函数指定不同的核函数。已经提供了通用核函数，但也可以指定自定义核函数。

支持向量机的缺点包括：

如果特征数量远远大于样本数，则在选择核函数和正则化项时要避免过度拟合。
SVMs不直接提供概率估计，这些计算使用昂贵的五倍交叉验证(见分数和概率)。

SVC, NuSVC 和 LinearSVC需要两个数组作为输入，[n_samples, n_features]尺寸的数组X作为训练样本，, [n_samples] 大小的数组 y 作为类别标签(字符串或者整数):

>>> from sklearn import svm
>>> X = [[0, 0], [1, 1]]
>>> y = [0, 1]
>>> clf = svm.SVC()
>>> clf.fit(X, y)
SVC()
>>> clf.predict([[2., 2.]])
array([1])
>>> # 获取支持向量
>>> clf.support_vectors_
array([[0., 0.],
       [1., 1.]])
>>> # 获取支持向量的索引
>>> clf.support_
array([0, 1]...)
>>> # 获取每个类中支持向量的个数
>>> clf.n_support_
array([1, 1]...)

最大超平面边距

import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm
from sklearn.datasets import make_blobs


# we create 40 separable points
X, y = make_blobs(n_samples=40, centers=2, random_state=6)

# fit the model, don't regularize for illustration purposes
clf = svm.SVC(kernel='linear', C=1000)
clf.fit(X, y)

plt.scatter(X[:, 0], X[:, 1], c=y, s=30, cmap=plt.cm.Paired)

# plot the decision function
ax = plt.gca()
xlim = ax.get_xlim()
ylim = ax.get_ylim()

# create grid to evaluate model
xx = np.linspace(xlim[0], xlim[1], 30)
yy = np.linspace(ylim[0], ylim[1], 30)
YY, XX = np.meshgrid(yy, xx)
xy = np.vstack([XX.ravel(), YY.ravel()]).T
Z = clf.decision_function(xy).reshape(XX.shape)

# plot decision boundary and margins
ax.contour(XX, YY, Z, colors='k', levels=[-1, 0, 1], alpha=0.5,
           linestyles=['--', '-', '--'])
# plot support vectors
ax.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], s=100,
           linewidth=1, facecolors='none', edgecolors='k')
plt.show()

非线性SVM

plot svm nonlinear

import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm

xx, yy = np.meshgrid(np.linspace(-3, 3, 500),
                     np.linspace(-3, 3, 500))
np.random.seed(0)
X = np.random.randn(300, 2)
Y = np.logical_xor(X[:, 0] > 0, X[:, 1] > 0)

# fit the model
clf = svm.NuSVC(gamma='auto')
clf.fit(X, Y)

# plot the decision function for each datapoint on the grid
Z = clf.decision_function(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

plt.imshow(Z, interpolation='nearest',
           extent=(xx.min(), xx.max(), yy.min(), yy.max()), aspect='auto',
           origin='lower', cmap=plt.cm.PuOr_r)
contours = plt.contour(xx, yy, Z, levels=[0], linewidths=2,
                       linestyles='dashed')
plt.scatter(X[:, 0], X[:, 1], s=30, c=Y, cmap=plt.cm.Paired,
            edgecolors='k')
plt.xticks(())
plt.yticks(())
plt.axis([-3, 3, -3, 3])
plt.show()

欲扬yyds01

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
svm代码实现

支持向量机的优点有：在高维空间里也非常有效对于数据维度远高于数据样本量的情况也有效在决策函数中使用训练集的子集(也称为支持向量)，因此也是内存高效利用的。通用性：可以为决策函数指定不同的核函数。已经提供了通用核函数，但也可以指定自定义核函数。支持向量机的缺点包括：如果特征数量远远大于样本数，则在选择核函数和正则化项时要避免过度拟合。 SVMs不直接提供概率估计，这些计算使用昂贵的五倍交叉验证(见分数和概率)。 SVC,NuSVC和..
复制链接

扫一扫

专栏目录