机器学习SVM复习笔记

最新推荐文章于 2022-07-24 23:06:05 发布

aattuuoo

最新推荐文章于 2022-07-24 23:06:05 发布

阅读量250

点赞数

分类专栏：机器学习文章标签：机器学习支持向量机

本文链接：https://blog.csdn.net/weixin_44583021/article/details/106004850

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

SVM

线性可分

线性可分的严格定义：一个训练样本集{(Xi, yi)…(Xn, yn)},在i=1~N线性可分，是指存在(w1, w2, b),使得i=1-N,有：
在这里插入图片描述
最简形式为：

SVM解决的问题

在能够线性可分的数据集中，会存在多条分界线。
在这里插入图片描述
为了寻找唯一的最优分类直线，该直线应满足以下三个条件：

该直线分开了两类样本。
该直线最大化间隔(支持向量之间的距离)。
该直线处于间隔的中间，到所有支持向量的距离相等。

SVM的优化问题描述

优化问题可以写成如下的形式：在这里插入图片描述
得到以上推导需要以下两个事实：

由事实一可以对分类超平面进行倍增，使得我们的支持向量满足 $y(W^Tx+b)=1$ 于是可以得到新的限制条件和优化目标:
$min:1/2||W||^2$
$y_i(W^Tx+b)>=1,i=1-N$

松弛变量

对于线性不可分问题，需要适当放松限制条件。C为超参数。
在这里插入图片描述

低维映射高维

对于一些线性不可分问题，采用线性可分的策略，分类效果不好。因此需要对特征进行映射，从低维映射到高维。定义一个映射函数 $φ (x)$ 使得优化问题变为：
在这里插入图片描述

核函数

运用核函数可以不用已知 $φ (x)$ 的具体形式而对需要预测的样本进行预测。核函数形式如下：
在这里插入图片描述
通过 $φ (x)$ 可以求解其对应的核函数，反之亦然。下面是一个例子：

通过核函数求解映射：
下面映射的维度可以交换

核函数K和 $φ (x)$ 为一一对应的关系，但是核函数的形式不能随意取，只有满足以下条件时才能分解为两个 $φ$ 内积的形式。
在这里插入图片描述
同时，可以知道高斯核是满足以上定理的：

对偶问题的定义

原问题与对偶问题的定义：
在这里插入图片描述
定义对偶问题如下：

对 $L (w, α, β)$ 遍历所有定义域上的 $w$ 去找到使得 $L (w, α, β)$ 最小的 $w$ ，同时将最小的这个值赋值给 $Θ (α, β)$ 。
定理一：
$f(w^*)>=Θ(α,β)$

定义对偶差距为 $f(w^*)-Θ(α,β)$
强对偶定理：如果 $g (w) = A w + b, h (w) = C w + d, f (w)$ 为凸函数则有 $f(w^*)-Θ(α,β)=0$ 对偶差距为0.
据定理一推出的不等式：
在这里插入图片描述

支持向量机转化为对偶问题

当前支持向量机的优化问题：
在这里插入图片描述
为了与上述描述的原问题一致，需要进行变换，将 $δ_i>=0 转换为δ_i<=0$ 因此变换为：

因为两个限制条件均为线性，且目标问题为凸优化问题，因此满足强对偶定理。
因此对偶问题如下：

由于需要遍历所有的w求得最小值，可以对其进行求导。
在这里插入图片描述
将求得的三个等式带入：

支持向量机的算法流程

b的求解：如果对于某个
$i,α_i≠0且α_i≠C,则根据KKT条件必有δ_i=0;$
在这里插入图片描述

对于新样本依据核函数同样可以进行预测：

总结支持向量机训练核测试的流程
训练过程：
输入训练数据，{(Xi, yi)}, i=1~N, 其中yi = -1或1.

预测过程：

aattuuoo

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习SVM复习笔记

SVM线性可分SVM解决的问题SVM的优化问题描述松弛变量低维映射高维核函数对偶问题的定义支持向量机转化为对偶问题支持向量机的算法流程线性可分线性可分的严格定义：一个训练样本集{(Xi, yi)…(Xn, yn)},在i=1~N线性可分，是指存在(w1, w2, b),使得i=1-N,有：最简形式为：SVM解决的问题在能够线性可分的数据集中，会存在多条分界线。为了寻找唯一的最优分类直线，该直线应满足以下三个条件：该直线分开了两类样本。该直线最大化间隔(支持向量之间的距离)。该直线处
复制链接

扫一扫