支持向量机（SVM）详解（三）

最新推荐文章于 2025-02-24 14:31:22 发布

RuizhiHe

最新推荐文章于 2025-02-24 14:31:22 发布

阅读量2.1k

点赞数 9

分类专栏：传统机器学习文章标签：人工智能机器学习支持向量机 svm 监督学习

本文链接：https://blog.csdn.net/qq_24178985/article/details/116333160

版权

传统机器学习专栏收录该内容

3 篇文章

订阅专栏

本文深入探讨支持向量机（SVM）的核函数，包括线性、多项式、高斯RBF、Sigmoid和自定义核，并介绍了它们在不同特征维度下的适用性。同时，详细阐述了SVM解决多分类问题的三种策略，指出实际应用中常采用的方法。此外，总结了SVM的优缺点，强调了训练样本不平衡和大量支持向量可能导致的问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 前言

前文：
支持向量机（SVM）详解（一）
支持向量机（SVM）详解（二）
前文详细推导了支持向量机算法原理。本文将介绍支持向量机常用核函数、支持向量机解决多分类问题方法，以及支持向量机解决实际问题的一些经验。

2. 支持向量机的核函数

支持向量机库（如LIBSVM）一般会支持如下五种核函数：

线性内核(Linear)： $K(X_i,X_j)=X_i^TX_j$
显然，当 $K(X_i,X_j)=X_i^TX_j$ ，则低维到高维的映射 $\varphi(X)=X$ 。因此，如果使用线性核函数，则使用核函数求解支持向量机与不使用核函数获得的结果是完全一样的。
多项式核(Polynomial)： $K(X_i,X_j)=(\gamma X_i^TX_j+b)^d$
$\gamma$ 和 $b$ 都是人为设置的超参数。多项式核是复杂度可以调节的核函数，可以证明，指数 $d$ 越大，则低维到高维的映射 $\varphi(X)$ 的维度越高。实际运用中，可以调节 $d$ 的大小来控制 $\varphi(X)$ 的维度，从而控制核函数的复杂度。
高斯径向基函数核(Radial basis function)： $K(X_i,X_j)=e^{-\gamma||X_i-X_j||^2}$
$\gamma$ 是人为设置的超参数。可以证明，RBF核对应的映射函数 $\varphi(X)$ 的维度是无限维。
Sigmoid核(Tanh)： $K(X_i,X_j)=tanh(\gamma{X_i^T}X_j+b)$ ，其中： $tanh(x)=\frac{e^x-e^{-x}}{e^x+e^{-x}}$
$\gamma$ 和 $b$ 都是人为设置的超参数。该核函数对应的 $\varphi(X)$ 维度也是无限的。
自定义核(Precomputed kernel)：
$\begin{bmatrix} K(X_1,X_2) & \dots & K(X_1,X_n) \\ \vdots & \ddots & \vdots \\ K(X_n,X_1) & \cdots & K(X_n,X_n) \end{bmatrix}$
如果知道所有的 $K(X_i,X_j)$ 的值，则可以将这些值代入支持向量机优化问题求解问题中，解出所有 $\alpha$ ，从而完成对支持向量机的求解。

在实际应用中，如果数据特征维度较大，则首选线性核函数。如果线性核函数效果不理想，则考虑RBF核函数，其次再考虑使用其余核函数；
如果数据特征维度不是特别大，建议首选RBF核函数。RBF核函数是实际编程中公认的、最常用的核函数，如果在实际问题中不知道该用什么样的核函数，建议首先采用RBF核函数。

3. 支持向量机解决多分类问题

3.1 改造优化目标函数和限制条件

支持向量机解决多分类问题思路一是通过改造其优化目标函数和限制条件，使之能够处理多分类问题，具体参见Multi-Class Support Vector Machine。

3.2 1类 vs k-1类

构造K个支持向量机：类别i VS 类别1,2,3,…,i-1,i+1,…,k（i从1到K）。对于每个优化问题，左边单一类别的标签为+1，右边k-1个类别的标签为-1。解出这k个优化问题后，获得k个 $\alpha$ 和 $b$ 的组合： $\alpha_i^{(k)},b^{(k)},~~i=1\sim n,k=1\sim K$ 。对于一个测试样本 $X_t$ ，将其类别判定为 $k_{max}=argmax\sum_{i=1}^n\alpha_i^{(k)}y_iK(X_i,X_t)+b^{(k)},~~k=1\sim K$ 。即寻找与其它类间隔最大的一类，将之作为测试样本 $X_t$ 的预测标签。

3.3 1类 vs 另一类

构造 $\frac{k(k-1)}{2}$ 个支持向量机，对于某个测试样本 $X_t$ ，将其输入 $\frac{k(k-1)}{2}$ 个支持向量机中，分别获得相应的类别标签，然后采取投票的方式获得最后的结果。
当出现平票情况，将 $sorce=\sum_{i=1}^n\alpha_iy_iK(X_i,X_t)+b$ 的值作为进一步判断的依据。分别计算类别 $i$ 的k-1个支持向量机的分数和，最后识别结果为分数最高的类别。（总共构造了 $\frac{k(k-1)}{2}$ 个支持向量机，与类别 $i$ 相关的支持向量机个数均为k-1个）

通过支持向量机（SVM）详解（一）和支持向量机（SVM）详解（二）可知，支持向量机天生是为二分类问题设计的，3.1所述方法在实际运用中一般不被采用；
3.2所述方法存在严重的训练样本不平衡问题，即结果会偏向训练样本较多的一类；
实际运用中一般采用3.3所述方法。

4. 支持向量机的优缺点

4.1 优点

有严格的数学理论支持，可解释性强，不依靠统计方法，从而简化了通常的分类和回归问题；
能找出对任务至关重要的关键样本（支持向量）；
采用映射到高维的解决方法之后，可以处理非线性分类/回归任务；
最终决策函数只由少数的支持向量所确定，计算的复杂性取决于支持向量的数目，而不是样本空间的维数，这在某种意义上避免了“维数灾难”。

4.2 缺点

训练时间长。当采用 SMO 算法时，由于每次都需要挑选一对参数，因此时间复杂度为 $O(n^2)$ ，其中 n 为训练样本的数量；
当采用核技巧时，如果需要存储核矩阵，则空间复杂度为 $O(n^2)$ ；
模型预测时，预测时间与支持向量的个数成正比。当支持向量的数量较大时，预测计算复杂度较高。因此支持向量机只适合小批量样本的任务，无法适应百万甚至上亿样本的任务。

5. 支持向量机训练经验

有关支持向量机使用详细经验可参见LIBSVM – A Library for Support Vector Machines和A Practical Guide to Support Vector Classification。
在实际运用中，支持向量最多占训练样本的20%-30%，如果支持向量特别多，基本上说明模型没有训练好。极端情况下，会出现所有训练样本均为支持向量的情况。出现上述情况一般说明存在如下3个问题：