吃瓜 |Task5 支持向量机

最新推荐文章于 2024-08-29 16:57:08 发布

西西想上岸

最新推荐文章于 2024-08-29 16:57:08 发布

阅读量50

点赞数 1

文章标签：支持向量机算法机器学习

本文链接：https://blog.csdn.net/m0_62322288/article/details/133976849

版权

第六章支持向量机

支持向量机：找距离正负样本都最远的超平面，其解唯一，且不偏不倚，泛化性能较感知机模型更好。

超平面 $(w^Tx+b=0,w,x\in \mathbb{R^n})$

方程不唯一
法向量w和位移项b确定唯一超平面
w垂直于超平面
w指向一半为正空间，另一半为负空间
任意点x到超平面距离公式 $f=\frac{\left| w^Tx+b \right|}{\Vert w \Vert}$

几何间隔

给定数据集和超平面，样本点为 $(x_i,y_i),y_i\in$ {-1,1}
$\gamma_i=\frac{y_i\left| w^Tx+b \right|}{\Vert w \Vert}$ ，正确分类时 $\gamma_i>0$ ，几何间隔等价于点到超平面距离
定义数据集关于超平面的几何间隔： $\gamma=\underset{i=1,2,···,m}{min}\gamma_i$

支持向量机
前提：线性可分数据集 $X$
模型：求得数据集关于超平面的几何间隔 $\gamma$ 达到最大（距离正负样本最远）的超平面，套上sign函数实现分类 $y=sign(w^Tx+b)=\left\{ \begin{array}{c}1,w^Tx+b>0\\0,w^Tx+b<0\\ \end{array} \right.$

寻求这样的一个超平面

求解 $\gamma=max\gamma_{min}=max\frac{y_{min}\left| w^Tx_{min}+b \right|}{\Vert w \Vert}$
使得有唯一解，给出约束条件 $y_{min}\left| w^Tx_{min}+b \right|=1$ （任意取，不唯一）
恒等变换：支持向量机主问题 $\underset{w,b}{min}\frac{1}{2}\Vert w \Vert^2~~~s.t.~~1-y_i（w^Tx+b ）\le0,i=1,2···,m$
凸优化问题求解：拉格朗日对偶

凸优化问题：目标函数是凸函数（ $\frac{y_1+y_2}{2}>f\left(\frac{x_1+x_2}{2}\right)$ ），约束集合是凸集
一般约束优化问题：
$min f (x)$ $~~g_i(x)\le0,h_j(x)=0$
拉格朗日函数
$L(x,\mu,\lambda)=f(x)+\sum^{m}_{i=1}\mu_ig_i(x)+\sum^{m}_{j=1}\lambda_jh_j(x)$
拉格朗日对偶函数 $\Gamma(\mu,\lambda)$ 为 $L(x,\mu,\lambda)$ 关于x的下确界
$\Gamma(\mu,\lambda)=inf~L(x,\mu,\lambda)=inf~f(x)+\sum^{m}_{i=1}\mu_ig_i(x)+\sum^{m}_{j=1}\lambda_jh_j(x)$
对偶函数优越性质：
1.对偶函数恒为凹函数
2.当 $\mu<0$ 时， $\Gamma(\mu,\lambda) \le f(\tilde x)\le p^*$ $\sum^{m}_{j=1}\lambda_jh_j(x)=0$ , $\sum^{m}_{i=1}\mu_ig_i(x)\le0$ ,
$L(x,\mu,\lambda)=f(x)+\sum^{m}_{i=1}\mu_ig_i(x)+\sum^{m}_{j=1}\lambda_jh_j(x)<f(x)$
所以 $\Gamma(\mu,\lambda)=inf~L(x,\mu,\lambda)\le L(\tilde x,\mu,\lambda) \le f(\tilde x)\le p^*$

所以我们要求解对偶问题：
$max~~\Gamma(\mu,\lambda)$ $s.t.~~\mu\ge0$
设最优解为 $d^*,d^*\le p^*$ （弱对偶性），当等号成立时为强对偶性

KKT条件
$f(x),g_i(x),h_j(x)$ 一阶偏导连续， $x^*,(\mu^*,\lambda^*)$ 为主问题和对偶问题的最优解，强对偶性成立，有以下条件
$\left\{ \begin{array}{c} \nabla _xL\left( x^*,\mu ^*,\lambda ^* \right) =\nabla f\left( x^* \right) +\sum_{i=1}^m{\mu _{i}^{*}\nabla g_i\left( x^* \right)}+\sum_{j=1}^n{\lambda _{j}^{*}\nabla h_i\left( x^* \right) =0}\\ h_i\left( x^* \right) =0\\ g_i\left( x^* \right) \leqslant 0\\ \mu _{i}^{*}\geqslant 0\\ \mu _{i}^{*}g_i\left( x^* \right) =0\\ \end{array} \right.$

解答：

主问题：
$\underset{w,b}{min}\frac{1}{2}\Vert w \Vert^2~~~s.t.~~1-y_i（w^Tx+b ）\le0,i=1,2···,m$
拉格朗日函数：
$L(w,b,\alpha)=\frac{1}{2}\Vert w \Vert^2+\sum^{m}_{i=1}\alpha_i(1-y_i(w^Tx+b ))$
求解 $L(w,b,\alpha)$ 关于 $w, b$ 的下确界
将 $w, b$ 合并成为 $\hat w$ ，求其一阶导等于0得到最小值

对偶问题：
加多一个对于b的系数的约束 $\sum^{m}_{i=1}\alpha_iy_i=0$ ，对于对偶问题变成了求关于w的最小值的问题，与b无关了
但是同时还需要满足KKT的五个条件，其中等式约束没有用到，一阶导为0已经用过了。

采用拉格朗日对偶问题求解的原因：特征维数远高于数据量，转换成拉格朗日对偶问题，使得对偶问题和数据量成正比，解答更加高效解答。

西西想上岸

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
吃瓜 |Task5 支持向量机

wTxb0wx∈Rnf∥w∥∣wTxb∣xiyiyi∈γi∥w∥yi∣wTxb∣γi0γi12,⋅⋅⋅,mminγi前提：线性可分数据集X模型：求得数据集关于超平面的几何间隔γ达到最大（距离正负样本最远）的超平面，套上sign函数实现分类ysignwTxb1wTxb00wTxb0寻求这样的一个超平面maxγmax。
复制链接

扫一扫