支持向量机SVM(4)——核函数

最新推荐文章于 2024-07-19 00:12:38 发布

Donreen

最新推荐文章于 2024-07-19 00:12:38 发布

阅读量1.3k

点赞数

分类专栏：机器学习入门文章标签：支持向量机 SVM 核函数机器学习

本文链接：https://blog.csdn.net/carrylvan/article/details/102950363

版权

机器学习入门专栏收录该内容

19 篇文章 5 订阅

订阅专栏

支持向量机SVM——核函数

接前面所讲博客，我们知道了当数据理想线性可分的话我们可以用硬间隔的方式解决，即使出现了噪声，软间隔依旧能够处理，但是这些的前提都是数据是线性可分的，但是在现实任务中，原始样本空间可能并不是线性可分的。
对于这类非线性分类问题的一种解决方法是：首先使用一个变换将原始空间中的数据映射到新空间；然后在新空间里用线性分类学习方法学习分类模型。这也是核函数的做法。

首先回顾一下我们的优化问题：
$\begin{cases}max_{\lambda}\;(-\frac{1}{2}\sum_{i=1}^N\sum_{j=1}^N\lambda_i\lambda_jy_iy_jx^T_ix_j+\sum_{i=1}^N\lambda_i)\\ s.t. \quad 0\leq\lambda_i\leq C\\\qquad\sum_{i=1}^N\lambda_iy_i=0\end{cases}$
令 $\phi(x)$ 表示找到的一种变换（映射），于是我们的问题可以写成：
$max_{\lambda}\;(-\frac{1}{2}\sum_{i=1}^N\sum_{j=1}^N\lambda_i\lambda_jy_iy_j\phi(x_i)^T\phi(x_j)+\sum_{i=1}^N\lambda_i)$
因为 $x_i，x_j$ 映射后的样本空间维数可能很高，甚至可能是无穷维，因此直接计算 $\phi(x_i)^T\phi(x_j)$ 通常是困难的。为了解决这个问题，我们可以先设：
$k(x_i,x_j)=\phi(x_i)^T\phi(x_j)$
即我们希望把映射后的特征空间的内积 $\phi(x_i)^T\phi(x_j)$ 转换为在原始样本空间中通过函数 $k(x_i,x_j)$ 来计算，相当于达到了降维计算的目的。并且 $k(x_i,x_j)$ 也称为核函数（kernel function）。