统计学习方法笔记（十一）支持向量机（三）

最新推荐文章于 2024-01-04 14:53:23 发布

yeyustudy

最新推荐文章于 2024-01-04 14:53:23 发布

阅读量273

点赞数

分类专栏：统计学习方法笔记

本文链接：https://blog.csdn.net/yeyustudy/article/details/80302986

版权

统计学习方法笔记专栏收录该内容

23 篇文章 0 订阅

订阅专栏

非线性支持向量机与核函数

一、核技巧
1、非线性分类问题是指通过非线性模型才能很好的进行分类的问题。如下图所示：
这里写图片描述
很显然，不能通过直线（线性模型）将图示实例点进行分离，只能通过一条椭圆曲线。
在实际问题中，非线性问题往往很难求解，然而，如果我们可以先将其变成线性问题，再进行求解，那么问题就得到了解决。
使用线性分类方法求解非线性问题的步骤：首先使用一个变换将原空间的数据映射到新空间，然后在新空间用线性分类学习方法进行分类。核技巧就是这样的方法。
所谓的核技巧实际就是使用核函数的方法，将其应用到向量机，其实质就是通过一个非线性变换将输入空间（欧式空间）对应到一个特征空间（希尔伯特空间），使得在输入空间中的超曲面模型对于特征空间中的超平面空间。
2、核函数
定义：设 ${\cal X}$ 是输入空间，又设 ${\cal H}$ 为特征空间，如果存在一个映射：
$\phi (x):{\cal X} \to {\cal H}$
使得对所有的 $x,z \in {\cal X}$ ，函数 $K(x,z)$ 满足条件
$K(x,z) = \phi (x) \cdot \phi (z)$
则称 $K(x,z)$ 为核函数
核技巧的想法是通常只定义核函数，而不显式的定义映射函数。
3、核技巧在线性支持向量机中的应用
在对偶问题的目标函数中的内积 $x_i \cdot x_j$ 用核函数 $K({x_i},{z_j}) = \phi ({x_i}) \cdot \phi ({z_j})$ 代替，此时，对偶问题的目标函数变为：
$W(\alpha ) = \frac{1}{2}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {{\alpha _i}{\alpha _j}{y_i}{y_j}K({x_i},{z_j})} } - \sum\limits_{i = 1}^N {{\alpha _i}}$
二、正定核
通常所说的核函数就是指正定核
假设 $K(x,z)$ 是定义在 ${\cal X} \times {\cal X}$ 的对称函数，对于任意的 ${x_1},{x_2}, \cdots ,{x_m} \in {\cal X}$ ， $K(x,z)$ 关于 ${x_1},{x_2}, \cdots ,{x_m}$ 的Gram矩阵是半正定的，可以依据函数 $K(x,z)$ 构造一个希尔伯特空间，其步骤是，首先定义映射 $\phi$ 构成向量空间 $\cal S$ ，然后在上面定义内积称为内积空间，最后将其完备化构成希尔伯特空间。
先定义映射：
$\phi :x \to K( \cdot \;,x)$
根据这一映射定义线性组合：
$f( \cdot ) = \sum\limits_{i = 1}^m {{\alpha _i}K( \cdot ,{x_i})}$
之后在上面定义内积，使其称为内积空间
$f( \cdot ) = \sum\limits_{i = 1}^m {{\alpha _i}K( \cdot ,{x_i})}$
$g( \cdot ) = \sum\limits_{j = 1}^l {{\beta _j}K( \cdot ,{z_j})}$
定义运算*：
$f*g = \sum\limits_{i = 1}^m {\sum\limits_{j = 1}^l {{\alpha _i}{\beta _j}K({x_i},{z_j})} }$
将其完备化为希尔伯特空间
由于核K具有再生性，即满足：
$K( \cdot ,x) \cdot f = f(x)$
$K( \cdot ,x) \cdot K( \cdot ,z) = K(x,z)$
三、常用核函数
多项式核函数： $K(x,z) = {(x \cdot z + 1)^p}$
高斯核函数： $K(x,z) = \exp \left( { - \frac{{||x - z|{|^2}}}{{2{\sigma ^2}}}} \right)$
字符串核函数

序列最小最优化算法

算法提出的原因：训练样本容量很大时，许多最优化算法非常低效，由此导致了SMO算法的提出。
算法的思路：SMO算法是一种启发式算法，如果所有变量的解满足最优化问题的KKT条件，则这个最优化的解就可以得到了，因为KKT条件是最优化问题的充分必要条件，如果不满足KKT条件，此时选择两个变量，固定其他变量，针对这两个变量构造一个二次规划问题，这个二次规划问题的解应该更接近于原始二次规划问题的解，因为这会使得原始二次规划问题目标函数的值更小，且此时子问题可以通过解析方法求解。子问题共有两个变量，一个是违反KKT条件最严重的那个，另一个则是由约束条件自动确定。
整个SMO算法共包括两个部分：求解两个变量的二次规划的解析方法以及选择变量的启发方法
一、两个变量二次规划的求解方法
子问题写为：

min α 1, α 2 W (α 1, α 2) = 1 2 K 11 α 21 + 1 2 K 22 α 22 + y 1 y 2 K 12 α 1 α 2 - (α 1 + α 2) + y 1 α 1 \sum i = 3 N y i α i K i 1 + y 2 α 2 \sum i = 3 N y i α i K i 2

$\begin{array}{c} \mathop {\min }\limits_{{\alpha _1},{\alpha _2}} \;\;W({\alpha _1},{\alpha _2}) = \frac{1}{2}{K_{11}}\alpha _1^2 + \frac{1}{2}{K_{22}}\alpha _2^2 + {y_1}{y_2}{K_{12}}{\alpha _1}{\alpha _2}\\ - ({\alpha _1} + {\alpha _2}) + {y_1}{\alpha _1}\sum\limits_{i = 3}^N {{y_i}{\alpha _i}{K_{i1}}} + {y_2}{\alpha _2}\sum\limits_{i = 3}^N {{y_i}{\alpha _i}{K_{i2}}} \end{array}$

s.t.α1y1+α2y2=−∑i=3Nyiαi=ς s . t . α 1 y 1 + α 2 y 2 = − ∑ i = 3 N y i α i = ς $s.t.\;\;{\alpha _1}{y_1} + {\alpha _2}{y_2} = - \sum\limits_{i = 3}^N {{y_i}{\alpha _i}} = \varsigma$
对其求解即可
二、变量的选择方法
1、第一个变量的选择：选择违反KKT条件最严重的样本点
2、第二个变量的选择：选择

|E1−E2| | E 1 − E 2 | $|{E_1} - {E_2}|$ 最大时所对应的点
3、计算阈值和差值

yeyustudy

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法笔记（十一）支持向量机（三）

非线性支持向量机与核函数一、核技巧 1、非线性分类问题是指通过非线性模型才能很好的进行分类的问题。如下图所示：很显然，不能通过直线（线性模型）将图示实例点进行分离，只能通过一条椭圆曲线。在实际问题中，非线性问题往往很难求解，然而，如果我们可以先将其变成线性问题，再进行求解，那么问题就得到了解决。使用线性分类方法求解非线性问题的步骤：首先使用一个变换将原空间的数据映射到新空间，...
复制链接

扫一扫

专栏目录