SVM 支持向量机算法（Support Vector Machine ）【Python机器学习系列（十四

2401_84164672

于 2024-05-14 20:23:34 发布

阅读量776

点赞数 28

分类专栏：程序员文章标签：大数据面试学习

本文链接：https://blog.csdn.net/2401_84164672/article/details/138868733

版权

程序员专栏收录该内容

186 篇文章 1 订阅

订阅专栏

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

ωTxi+b=1成立。以此作为限制条件，这样就可以把分母消去了。

该约束条件可表示为

∣

≥

∣

r_i =\frac{\omega^Tx_i + b}{||\omega||}y_i≥\frac{1}{||\omega||}

ri=∣∣ω∣∣ωTxi+byi≥∣∣ω∣∣1

提示：这里的限制条件只用了一个表达式表示，实际上有m个（m也是样本点的个数）。每个样本点对应一个限制条件。
当且仅目标当样本

x_i

xi为支持向量时，等号成立，取得点到超平面的最小距离

∣

\frac{1}{||\omega||}

∣∣ω∣∣1。

目标函数，即点到超平面的最小距离

∣

\frac{1}{||\omega||}

∣∣ω∣∣1。要使该最小距离最大化，即

∣

||\omega||

∣∣ω∣∣最小，为了后边计算方便，进一步将研究问题及表达式转化为，求

∣

\frac{1}{2}||\omega||^2

21∣∣ω∣∣2关于

\omega

ω和

b的最小值。
目标函数即：

∣

min_{\omega,b}\frac{1}{2}||\omega||^2

minω,b21∣∣ω∣∣2

进一步，限制条件可再转化为：

(

)

−

≥

(\omega^Tx_i + b)y_i-1 ≥ 0

(ωTxi+b)yi−1≥0

2.2 Part2 SVM拉格朗日乘子法求解

现在我们已经得到了目标函数表达式与限制条件的表达式，可以使用拉格朗日乘子法对其进行求解。
构建拉格朗日函数表达式如下：

(

)

∣

∑

[

−

(

)

]

L(\omega,b,\lambda)=\frac{1}{2}||\omega||^2+\sum_{i=1}{m}{\lambda_i}{[1-(\omega^Tx_i+b)y_i]}

L(ω,b,λ)=21∣∣ω∣∣2+∑i=1mλi[1−(ωTxi+b)yi]

∑

[

−

(

)

]

=\frac{1}{2}\omega^T \omega+\sum_{i=1}^{{m}{\lambda_i}{[1-(\omega}Tx_i+b)y_i]}

=21ωTω+∑i=1mλi[1−(ωTxi+b)yi]

目标问题是一个凸二次规划问题：目标函数是二次型函数，且约束函数是仿射函数。所以该问题有全局最小值。

其中，

\lambda

λ是拉格朗日乘子，这里的m是样本的个数，每个样本对应一个拉格朗日算子，共计m个拉格朗日算子，对应m个限制条件。

对

(

)

对F(\omega,b,\lambda)

对F(ω,b,λ)求关于

\omega

ω 和

b的偏导，并令其为0，再求解：

∂

(

)

∂

−

∑

\frac{∂L(\omega,b,\lambda)}{∂\omega}=\omega-\sum_{i=1}^{m}\lambda_iy_ix_i=0

∂ω∂L(ω,b,λ)=ω−∑i=1mλiyixi=0

∂

(

)

∂

−

∑

\frac{∂L(\omega,b,\lambda)}{∂b}=-\sum_{i=1}^{m}\lambda_iy_i=0

∂b∂L(ω,b,λ)=−∑i=1mλiyi=0

解得

∑

\omega=\sum_{i=1}^{m}\lambda_iy_ix_i

ω=∑i=1mλiyixi

∑

0=\sum_{i=1}^{m}\lambda_iy_i

0=∑i=1mλiyi

将求解结果带回原

(

)

L(\omega,b,\lambda)

L(ω,b,λ)，并进一步化简得：

(

)

∑

−

∑

−

∑

L(\omega,b,\lambda)=\frac{1}{2}\omega^T \omega+\sum_{i=1}^{m}\lambda_i -\omega^T\sum_{i=1}{m}\lambda_iy_ix_i-b\sum_{i=1}^{m}\lambda_iy_i

L(ω,b,λ)=21ωTω+∑i=1mλi−ωT∑i=1mλiyixi−b∑i=1mλiyi

∑

−

=\sum_{i=1}^{{m}\lambda_i-\frac{1}{2}\omega}T\omega

=∑i=1mλi−21ωTω

∑

−

(

∑

)

(

∑

)

=\sum_{i=1}^{m}\lambda_i - \frac{1}{2}( \sum_{i=1}^{{m}\lambda_iy_ix_i)}T (\sum_{i=1}^{m}\lambda_iy_ix_i)

=∑i=1mλi−21(∑i=1mλiyixi)T(∑i=1mλiyixi)

∑

−

∑

=\sum_{i=1}^{{m}\lambda_i-\frac{1}{2}\sum_{i=1}}{m}\sum_{j=1}^{{m}\lambda_i\lambda_jy_iy_jx_i}Tx_j

=∑i=1mλi−21∑i=1m∑j=1mλiλjyiyjxiTxj

上边已经说到，将这两个表达式带入

(

)

L(\omega,b,\lambda)

L(ω,b,λ)后，我们得到的新的表达式中已经没有了

\omega

ω和

b，只剩下的参数为

\lambda

λ，这个新表达式的限制条件即为我们带入的两个式子，这两个式子表示该表达式关于

\omega

ω和

b的极小值。

进而求关于

\lambda

λ的极值，到此要求解的函数已经转化为：

∑

−

∑

\sum_{i=1}^{{m}\lambda_i-\frac{1}{2}\sum_{i=1}}{m}\sum_{j=1}^{{m}\lambda_i\lambda_jy_iy_jx_i}Tx_j

∑i=1mλi−21∑i=1m∑j=1mλiλjyiyjxiTxj

要求解的是该式关于

\lambda

λ的极大值，所以也即求解

∑

−

∑

\frac{1}{2}\sum_{i=1}^{{m}\sum_{j=1}}{m}\lambda_i\lambda_jy_iy_jx_i^{Tx_j-\sum_{i=1}}{m}\lambda_i

21∑i=1m∑j=1mλiλjyiyjxiTxj−∑i=1mλi

的极小值。

限制条件为：

s.t.

∑

\sum_{i=1}^{m}\lambda_iy_i=0

∑i=1mλiyi=0

≥

\lambda_i≥0

λi≥0, i=1,2,…,m

2.3 Part3 求解超平面

目标函数：

min_{\omega,b}

minω,b

∑

−

∑

\frac{1}{2}\sum_{i=1}^{{m}\sum_{j=1}}{m}\lambda_i\lambda_jy_iy_jx_i^{Tx_j-\sum_{i=1}}{m}\lambda_i

21∑i=1m∑j=1mλiλjyiyjxiTxj−∑i=1mλi

限制条件：

s.t.

∑

\sum_{i=1}^{m}\lambda_iy_i=0

∑i=1mλiyi=0

≥

\lambda_i≥0

λi≥0, i=1,2,…,m

然后接下来，不难发现这是一个二次规划问题，将每个样本点的

x_i

xi、

y_i

yi替换为样本值数字，然后求目标函数关于

\lambda_1

λ1，

\lambda_2

λ2，… ，

\lambda_n

λn的偏导数，并令其等于0，从而得到m个等式，联立这 m 个等式，以及

∑

\sum_{i=1}^{m}\lambda_iy_i=0

∑i=1mλiyi=0进行求解。理论上即可以求出

\lambda_1

λ1，

\lambda_2

λ2，… ，

\lambda_n

λn的值。

再将这些值代入表达式

∗

∑

\omega^*=\sum_{i=1}{m}\lambda_iy_ix_i

ω∗=∑i=1mλiyixi 即可求解出

∗

\omega^*

ω∗。（

\omega_1

ω1,

\omega_2

ω2, … ,

\omega_n

ωn）

再由公式

∗

−

∑

b^* =y-\sum_{i=1}^{{m}\lambda_iy_ix_i}Tx_i

b∗=y−∑i=1mλiyixiTxi

代入支持向量，即可求得参数b的值。这是一种解方程的思路。但是这种方法过于繁琐，只是理论上可行。
在解决这个问题方面，先辈们提出了很多高效的算法，比如SMO算法（Sequential Minimal Optimization）。
使用梯度下降法，也可以如愿求得超平面的方程。

最后，根据下式（符号函数sgn）即可对样本数据进行分类：

(

)

(

∗

)

f(x)=sgn(\omega^{*T}x+b*)

f(x)=sgn(ω∗Tx+b∗)

3.核函数

到此我们已经完整地实现了线性可分的支持向量机。但是现实中目标数据未必一直是线性可分的。面对这样的情况，我们可以使用核函数对原始目标数据进行“升维”操作。
如果原始数据是有限维的，那么一定会存在一个更高维的特征空间使得样本线性可分。
用

(

)

\phi(x)

ϕ(x)表示

x经过映射后的特征向量，则核函数可以表示为

(

)

(

)

(

)

(

)

(

)

k(x_i,x_j)=<\phi(x_i),\phi(x_j)>=\phi(x_i)^T\phi(x_j)

k(xi,xj)=<ϕ(xi),ϕ(xj)>=ϕ(xi)Tϕ(xj)

核函数的具体形式我们通常是不知道的。
但是 核函数定理表明，只要一个对称函数（

(

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

需要这份系统化资料的朋友，可以戳这里获取

\sum_{i=1}^{m}\lambda_iy_i=0

∑i=1mλiyi=0进行求解。理论上即可以求出

\lambda_1

λ1，

\lambda_2

λ2，… ，

\lambda_n

λn的值。

再将这些值代入表达式

∗

∑

\omega^*=\sum_{i=1}{m}\lambda_iy_ix_i

ω∗=∑i=1mλiyixi 即可求解出

∗

\omega^*

ω∗。（

\omega_1

ω1,

\omega_2

ω2, … ,

\omega_n

ωn）

再由公式

∗

−

∑

b^* =y-\sum_{i=1}^{{m}\lambda_iy_ix_i}Tx_i

最后，根据下式（符号函数sgn）即可对样本数据进行分类：

(

)

(

∗

)

f(x)=sgn(\omega^{*T}x+b*)

f(x)=sgn(ω∗Tx+b∗)

3.核函数

(

)

\phi(x)

ϕ(x)表示

x经过映射后的特征向量，则核函数可以表示为

(

)

(

)

(

)

(

)

(

)

k(x_i,x_j)=<\phi(x_i),\phi(x_j)>=\phi(x_i)^T\phi(x_j)

k(xi,xj)=<ϕ(xi),ϕ(xj)>=ϕ(xi)Tϕ(xj)

核函数的具体形式我们通常是不知道的。
但是 核函数定理表明，只要一个对称函数（

(

[外链图片转存中…(img-3p2FZBFE-1715689390705)]
[外链图片转存中…(img-DnuL0G22-1715689390706)]
[外链图片转存中…(img-rbIZ21tm-1715689390706)]

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

需要这份系统化资料的朋友，可以戳这里获取

2401_84164672

关注

28
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
SVM 支持向量机算法（Support Vector Machine ）【Python机器学习系列（十四

ωTxi+b=1成立。以此作为限制条件，这样就可以把分母消去了。该约束条件可表示为riωTxib∣∣ω∣∣yi≥1∣∣ω∣∣提示：这里的限制条件只用了一个表达式表示，实际上有m个（m也是样本点的个数）。每个样本点对应一个限制条件。当且仅目标当样本xix_ixi为支持向量时，等号成立，取得点到超平面的最小距离1∣∣ω∣∣∣∣ω∣∣1。目标函数，即点到超平面的最小距离1∣∣ω∣∣∣∣ω∣∣1。
复制链接

扫一扫