SVM_2

最新推荐文章于 2023-08-17 10:21:19 发布

George_Dong

最新推荐文章于 2023-08-17 10:21:19 发布

阅读量348

点赞数

分类专栏： MachineLearning

本文链接：https://blog.csdn.net/George_Dong/article/details/85041687

版权

MachineLearning 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

文章目录

SVM进阶
- 核函数
- - 核函数定理

SVM进阶

核函数

在推导SVM公式时，我们假设训练样本是线性可分的，即存在一个划分超平面能将训练样本正确分类。然而在实际应用中，原始样本空间也许并不存在一个能正确划分样本类的超平面。例如，“异或”问题就不是线性可分的。

对这样的问题，可将样本从原始空间映射到一个更高维的特征空间，使得样本在这个特征空间内线性可分。

令 $\phi(x)$ 表示将 $x$ 映射后的特征向量，于是，在特征空间中划分超平面所对应的模型可表示为 $w^T\phi(x)+b$ 其中 $w$ 和 $b$ 是模型参数。其模型可表示为 $\min\limits_{w,b}\frac{1}{2}||w||^2 \\ s.t. ~~~~ y_i(w^T\phi(x_i)+b)\geq1,i=1,2,\ldots,m.$ 其对偶问题为：
$\tag{1}\max\limits_\alpha\sum_{i=1}^{m}\alpha_i-\frac{1}{2}\sum_{i=1}^{m}\sum_{j=1}^{m}\alpha_i\alpha_jy_iy_j\phi(x_i)^T\phi(x_j)^T \\ s.t.~~~~\sum_{i=1}^{m}\alpha_iy_i=0, \\ \alpha_i \geq0,i=1,2,\ldots,m.$
求解上式涉及到计算 $\theta(x_i)^T\theta(x_j)$ ,这是样本 $x_i$ 与 $x_j$ 映射到特征空间后的内积。由于特征空间维数可能很高，甚至无穷维，直接计算困难。为了避开这个障碍，可以设想一个函数： $\tag{2}\kappa(x_i,x_j)=\langle\phi(x_i),\phi(x_j)\rangle=\phi(x_i)^T\phi(x_j)$ 把（2）式带入（1）式可得 $\tag{3}\max\limits_\alpha\sum_{i=1}^{m}\alpha_i-\frac{1}{2}\sum_{i=1}^{m}\sum_{j=1}^{m}\alpha_i\alpha_jy_iy_j\kappa(x_i,x_j) \\ s.t.~~~~\sum_{i=1}^{m}\alpha_iy_i=0, \\ \alpha_i \geq0,i=1,2,\ldots,m.$ 求解后可得 $\tag{4}f(x) = w^T\phi(x)+b=\sum_{i=1}^{m}\alpha_iy_i\phi(x_i)^T\phi(x)+b=\sum_{i=1}^{m}\alpha_iy_i\kappa(x,x_i)+b~~$

核函数定理

令 $\chi$ 为输入空间， $\kappa(\cdot,\cdot)$ 是定义在 $\chi$ x $\chi$ 上的对称函数，则 $\kappa$ 是核函数当且仅当对于任意数据 $D=\{x_1, x_2, \dots, x_m\}$ ，“核矩阵” $K$ 总是半正定的： $\tag{5}K = \begin{bmatrix} \kappa(x_1,x_2) & \ldots & \kappa(x_1, x_j) &\ldots&\kappa(x_1,x_m) \\ \vdots & \ddots & \vdots &\ddots&\vdots\\ \kappa(x_i,x_1)&\ldots&\kappa(x_i,x_j)&\ldots&\kappa(x_i,x_m)\\ \vdots & \ddots & \vdots &\ddots&\vdots\\ \kappa(x_m,x_1)&\ldots&\kappa(x_m,x_j)&\ldots&\kappa(x_m,x_m) \end{bmatrix}$ 公式（5）表明，只要一个对称函数所对应的核矩阵半正定，它就能作为核函数使用。事实上，对于一个半正定核矩阵，总能找到一个与之对应的映射 $\phi$ 。换言之，任何一个核函数都隐式地定义了一个称为“再生核希尔伯特空间”（Reproducing Kernel Hilbert Space，简称RKHS）的特征空间。

通过前面的讨论可知，我们希望样本在特征向量空间内线性可分，因此特征空间的好坏对支持向量机的性能至关重要。需要注意的是，在不知道特征映射的形式时，我们并不知道什么样的核函数是合适的，而核函数也仅是隐式的定义了这个特征空间。于是，“核函数选择”成为支持向量机的最大变数。若核函数选择不合适，则意味着将本样本映射到了一个不合适的特征空间，很可能导致性能不佳。

名称	表达式	参数
线性核	$\kappa(x_i,x_j)=x_i^Tx_j$
多项式核	$\kappa(x_i,x_j)=(x_i^T x_j)^d$	$d\geq1$ 为多项式的次数
高斯核	$\kappa(x_i,x_j)=exp(\frac{\\|x_i-x_j\\|^2}{2\sigma^2})$	$\sigma>0$ 为高斯核的带宽
拉普拉斯核	$\kappa(x_i,x_j)=exp(-\frac { \\|x_i-x_j\\|^2} {2\sigma^2})$	$\sigma>0$
Sigmoid核	$\kappa(x_i,x_j)=tanh(\beta x_i^Tx_j+\theta)$	$t a n h$ 为双曲正切函数， $\beta>0,\theta<0$

此外，还可以通过组合得到，例如：

若 $\kappa_1$ 和 $\kappa_2$ 为核函数，则对于任意正数 $\gamma_1$ 、 $\gamma_2$ ，其线性组合， $\gamma_1\kappa_1+\gamma_2\kappa_2$ 也是核函数
若 $\kappa_1$ 和 $\kappa_2$ 为核函数，则核函数的直积， $\kappa_1\otimes\kappa(x,z)=\kappa_1(x,z)\kappa_2(x,z)$ 也是核函数
若 $\kappa_1$ 为核函数，则对于任意函数 $g (x)$ ， $\kappa(x,z)=g(x)\kappa_1(x,z)g(z)$ 也是核函数