浙江大学《机器学习》MOOC课程笔记支持向量机SVM（二）

最新推荐文章于 2022-11-01 18:40:51 发布

prince75^

最新推荐文章于 2022-11-01 18:40:51 发布

阅读量519

点赞数 1

分类专栏：基础教学浙江大学文章标签：机器学习支持向量机 svm mooc 算法

本文链接：https://blog.csdn.net/m0_46648276/article/details/108943740

版权

基础教学同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

浙江大学

2 篇文章 0 订阅

订阅专栏

本文详细介绍了拉格朗日乘子法在解决优化问题中的应用，特别是针对SVM的支持向量机优化问题。通过对原问题的改造，引入拉格朗日函数和对偶问题的概念，阐述了对偶定理和强对偶定理，解释了如何将SVM的原问题转化为对偶问题。同时，讨论了如何求解对偶问题中的参数αi和b，以及如何利用这些参数进行预测。最后，探讨了SVM训练和测试的流程，强调了核函数在简化计算中的作用。

摘要由CSDN通过智能技术生成

原问题（PRIME PROBLEM）和对偶问题（DUAL PROBLEM) [半懂不懂一知半解懵懵懂懂]

拉格朗日乘子法

Step.1原函数
假设有K个不等式，m个等式

Step.2定义拉格朗日函数 $L(w,\alpha,\beta)$
为每条约束条件添加拉格朗日乘子 $\alpha_i≥0$

在这里插入图片描述
Step.3对偶函数

$L(w,\alpha,\beta)$ 遍历所有定义域上的 $w$ ,找到使 $L(w,\alpha,\beta)$ 最小的，同时将这个最小的函数值赋值给 $\theta(\alpha,\beta)$ 在这里插入图片描述

定理
1.定理一：对偶定理（DUALITY THEOREM)证明：

引申：对偶差距（DUALITY GAP）
在这里插入图片描述

2.定理二：强对偶定理（STRONG DUALITY THEOREM)
在这里插入图片描述

转化为对偶问题

将SVM的优化问题改造为原问题
为了让改进至目前的SVM的优化问题满足强对偶定理，而原问题中的 $g_i(w)≤0$ ，故首先要将SVM的两个限制条件由 $\geq 0$ 进行改造

此时原问题中的
在这里插入图片描述而不等式 $g_i(w)≤0$ 被分成了两部分

在这里插入图片描述
由于问题中全为不等式，故不存在 $h _i(w)=0$ 项。

按照对偶问题的定义将对偶问题写成如下形式：
在这里插入图片描述其中 $\alpha_i,\beta_i$ 分别是改造两个 $g_i(w)≤0$ 条件的系数，类比于原问题中的拉格朗日乘子 $\alpha_i$

如何将原问题化为对偶问题
由于要对 $w, δ _i,b)$ 分别遍历求最小值，所以对三个变量分别求导并令导数 $= 0$ (由于 $w$ 为向量，故使用向量求导准则）
将求得的三个式子带入表达式中，可以将SVM的原问题转化为对偶问题：

算法流程 [这个好难懂诶(#`O′)]

1.如何求解上述对偶问题
2.基于对偶问题给出SVM算法的统一流程

根据核函数的公式，只需要知道核函数的值，而无需知道具体的 $\phi(x_i),\phi^T(x_i)$ ,带入公式求解出所有的 $\alpha_i(i=1$ ~ $N)$ 后,可以根据求出 $w$
注意由于 $\phi(x_i)$ 不知道是否具有显示表达式，所以 $w$ 也不知道是否具有显示表达式。
如何求b
首先，

其次，根据KKT条件，对所有的 $i (1$ ~ $N)$ ，可以得到两个 $g_i(w)$ 分式 $= 0$ ，
$\left\{ \begin{aligned} &\beta_iδ_i=0 → (c-\alpha_i)δ_i=0& \\ &\alpha_i[1+δ_i-y_iw^T\phi(X_i)-y_ib]=0& \\ \end{aligned} \right.$
并且同时，如果对某个i， $\alpha_i≠0$ 且 $\alpha_i≠c$ ,则根据KKT条件，必有
$\left\{ \begin{aligned} &δ_i=0 & \\ &1+δ_i-y_iw^T\phi(X_i)-y_ib=0& \\ \end{aligned} \right.$

由于等式 $1+δ_i-y_iw^T\phi(X_i)-y_ib=0$ 中的项， $y_iw^T\phi(X_i)=\sum_{j=1}^N \alpha_iy_iy_jK(X_j,X_i)$
注意如果 $\alpha_i=0$ ，则该样本不会出现在公式的求和中出现，也就不会对 $f (x)$ 产生影响，如果 $\alpha_i＞0$ ，则必有 $y_if(x_i)=1$ ,所对应的样本点位于最大间隔边界上，是一个支持向量。
所以只需要找到 $0<\alpha_i<c$ ，那么 $b$ 的求解公式为：
在这里插入图片描述

对于一个测试样本X，如何获得其预测的类别
1.“核函数戏法”
2.只通过核函数，也能求得SVM算法最终预测的类别
3.SVM训练和测试的流程（基于对偶问题的求解）
a.训练过程
①输入训练数据

②求 $\alpha_i(i=1$ ~ $N)$

③求 $b$

b.测试过程

课后思考题

在这里插入图片描述

浙江大学《机器学习》 mooc课程

prince75^

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
浙江大学《机器学习》MOOC课程笔记支持向量机SVM（二）

转化为对偶问题将SVM的优化问题改造为原问题为了让改进至目前的SVM的优化问题满足强对偶定理，而原问题中的gi(w)≤0g_i(w)≤0gi(w)≤0，故首先要将SVM的两个限制条件由≥0≥0≥0进行改造此时原问题中的而不等式gi(w)≤0g_i(w)≤0gi(w)≤0被分成了两部分由于问题中全为不等式，故不存在hi(w)=0h_i(w)=0hi(w)=0项。按照对偶问题的定义将对偶问题写成如下形式：其中αi,βi\alpha_i,\beta_iαi,βi分别是改造两个gi
复制链接

扫一扫