scikit-learn学习1.4. 支持向量机(Support Vector Machines)

最新推荐文章于 2024-04-19 10:58:16 发布

大师鲁

最新推荐文章于 2024-04-19 10:58:16 发布

阅读量1.2k

点赞数

文章标签：机器学习数据挖掘

本文链接：https://blog.csdn.net/laolu1573/article/details/51125376

版权

SVM是一系列用于分类、回归、异常值检查的有监督学习方法。

SVM的优势：

在高维空间有效。
当样本特征维数比样本数大的时候依然有效。
在决策函数中只使用一部分训练样本（支持向量），所以内存使用效率很高。
多种使用方式：决策函数中可以指定不同的核函数，虽然提供了常用的核函数，但是也可以指定定制的核函数。

SVM的劣势：

如果特征的数目远远大于样本数，这种方法的表现可能很差。
SVMs不会直接提供概率估计，这可以通过5折交叉验证计算。(参考得分和概率部分)

1.4.1.分类

SVC，NuSVC和LinearSVC可以对数据集进行多分类。

SVC和NuSVC是类似的方法，但是输入参数略有不同，并且有不同的数学描述(参考数学公式部分)。但是LinearSVC是支持向量分类针对线性核函数情况的另一种实现。需要注意的是因为LinearSVC的假定是线性的，所以不需要指定核函数，它也缺少了SVC和NuSVC的一些成员，比如support_。

1.4.1.1.多分类

SVC和NuSVC使用“one-against-one”的方法(Knerr et al., 1990)来进行多分类。如果n_class是类别的数目，那么需要构建n_class * (n_class - 1) / 2个分类器，每个分类器从两个类别的数据训练。为了提供一个与其他分类器兼容的接口，通过decision_function_shape这个参数合并所有的“one-against-one”分类器结果成一个shape（n_samples, n_classes）的决策函数。

>>> X = [[0], [1], [2], [3]]
>>> Y = [0, 1, 2, 3]
>>> clf = svm.SVC(decision_function_shape='ovo')
>>> clf.fit(X, Y) 
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
    decision_function_shape='ovo', degree=3, gamma='auto', kernel='rbf',
    max_iter=-1, probability=False, random_state=None, shrinking=True,
    tol=0.001, verbose=False)
>>> dec = clf.decision_function([[1]])
>>> dec.shape[1] # 4 classes: 4*3/2 = 6
6
>>> clf.decision_function_shape = "ovr"
>>> dec = clf.decision_function([[1]])
>>> dec.shape[1] # 4 classes
4

LinearSVC使用“one-vs-the-rest”的多分类策略，因此只需要训练n_class个模型。如果只有两类，那么只需要训练一个模型:

>>> lin_clf = svm.LinearSVC()
>>> lin_clf.fit(X, Y) 
LinearSVC(C=1.0, class_weight=None, dual=True, fit_intercept=True,
     intercept_scaling=1, loss='squared_hinge', max_iter=1000,
     multi_class='ovr', penalty='l2', random_state=None, tol=0.0001,
     verbose=0)
>>> dec = lin_clf.decision_function([[1]])
>>> dec.shape[1]
4

1.4.2.回归

支持向量分类理论可以被扩展到解决回归问题。这种理论被称为支持向量回归。

（未完结）

大师鲁

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scikit-learn学习1.4. 支持向量机(Support Vector Machines)

SVM是一系列用于分类、回归、异常值检查的有监督学习方法。SVM的优势：在高维空间有效。当样本特征维数比样本数大的时候依然有效。在决策函数中只使用一部分训练样本（支持向量），所以内存使用效率很高。多种使用方式：决策函数中可以指定不同的核函数，虽然提供了常用的核函数，但是也可以指定定制的核函数。SVM的劣势：如果特征的数目远远大于样本数，这种方法的表现可能很差。SVMs不会直
复制链接

扫一扫