【机器学习】—SVM中拉格朗日算法和SMO算法

最新推荐文章于 2023-10-21 21:46:02 发布

天阑的芋头

最新推荐文章于 2023-10-21 21:46:02 发布

阅读量1.3k

点赞数 4

分类专栏： # 机器学习文章标签：拉格朗日乘子法 SMO算法机器学习 SVM

本文链接：https://blog.csdn.net/qq_34069667/article/details/108304325

版权

这篇博客深入探讨了支持向量机（SVM）中的拉格朗日乘子法和SMO算法。首先介绍了SVM的约束最优化问题，然后详细讲解了拉格朗日乘子法在解决有约束优化问题中的应用，特别是如何处理等式约束和不等式约束。接着，重点讨论了SMO算法，解释了其快速求解的原因和选择乘子的启发式策略。文章最后概述了SMO算法的特点和优势，强调了它在处理大规模样本时的效率和内存友好性。

摘要由CSDN通过智能技术生成

阅读之前看这里👉：博主是一名正在学习数据类知识的学生，在每个领域我们都应当是学生的心态，也不应该拥有身份标签来限制自己学习的范围，所以博客记录的是在学习过程中一些总结，也希望和大家一起进步，在记录之时，未免存在很多疏漏和不全，如有问题，还请私聊博主指正。
博客地址：天阑之蓝的博客，学习过程中不免有困难和迷茫，希望大家都能在这学习的过程中肯定自己，超越自己，最终创造自己。

1.SVM的约束最优化问题

SVM的具体原理很多博客和书籍都有介绍，我这里就不再详细介绍了，可以参考博客：SVM支持向量机算法介绍

通过间隔最大化，得到SVM的约束最优化问题：
$\mathop{min}\limits_{\omega,\beta} \frac{1}{2}\left \| \omega \right \|^2 \\ s.t. y_i(w\cdot x_i +b)-1\ge0, \qquad i = 1,2,...,m$

2.有约束求解问题(拉格朗日乘子法)

对于上述带有不等式约束的最优化问题，可以使用拉格朗日乘子法（Lagrange Multiplier）对其进行求解。

2.1各类最优化问题

首先先了解一下最优化问题的分类，最优化问题可以分为一下三类：

无约束的优化问题，可以写成： $\mathop{min}\limits_{x}f(x)$ 对于这类的优化问题，常常使用的方法就是Fermat定理，即使用求取f(x)的导数，然后令其为零，可以求得候选最优值，再在这些候选值中验证；如果是凸函数，可以保证是最优解。
有等式约束的优化问题，可以写成： $\mathop{min}\limits_{x}f(x) \\ s.t. h_i(x)=0, \qquad i = 1,2,...,m$ 对于这类的优化问题，常常使用的方法就是拉格朗日乘子法（Lagrange Multiplier) ，即把等式约束用一个系数与目标函数 $f (x)$ 写为一个式子，称为拉格朗日函数，而系数称为拉格朗日乘子。拉格朗日函数的形式如下， $\mu$ 即拉格朗日乘子：
$L(x,\mu)=f(x)-\mu h(x)$ 通过拉格朗日函数对各个变量求导，令其为零，可以求得候选值集合，然后验证求得最优值。
不等式约束的优化问题，可以写成： $\mathop{min}\limits_{x}f(x)$

对于这类的优化问题，常常使用的方法就是KKT条件。同样地，我们把所有的等式、不等式约束与 $f (x)$ 写为一个式子，也叫拉格朗日函数，系数也称拉格朗日乘子，通过一些条件，可以求出最优值的必要条件，这个条件称为KKT条件。

2.2 如何利用拉格朗日乘子法求解

拉格朗日乘子法可以应用于有等式约束的优化问题和有不等式约束的优化问题

对于有等式约束的优化问题：
$\mathop{min}\limits_{x}f(x) \\ s.t. h_i(x)=0, \qquad i = 1,2,...,m$ 其中 $f (x)$ 被称为目标函数。

(1)无约束条件的时候

当没有约束条件的时候，我们通过求导的方法，来寻找最优点，设 $x^*$ 是这个最优点，即此时有

在这里插入图片描述
此外，如果 $f (x)$ 是一个实值函数， $\vec{x}$ 是一个 $n$ 维向量的话，那么 $f (x)$ 对向量 $\vec{x}$ 的导数被定义为

在这里插入图片描述

(2)有等式约束条件的时候

当有一个等式约束条件在这里插入图片描述
举例设
$\mathop{min}\limits_{x}f( x_1,x_2,x_3)$

在这里插入图片描述
从几何的角度看，可以看成是在一个曲面 $\Omega\{ x_1,x_2,x_3|_{h(x_1,x_2,x_3)=0}\}$ 上寻找函数 $f(x_1,x_2,x_3)$ 的最小值。

设目标函数 $z=f(x_1,x_2,x_3)$ ，当 z 取不同的值的时候，相当于可以投影在曲面 $\Omega\{ x_1,x_2,x_3|_{h(x_1,x_2,x_3)=0}\}$

最低0.47元/天解锁文章

天阑的芋头

关注

4
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】—SVM中拉格朗日算法和SMO算法

> 博客地址：[天阑之蓝的博客](https://blog.csdn.net/qq_34069667)，学习过程中不免有困难和迷茫，希望大家都能在这学习的过程中肯定自己，超越自己，最终创造自己。
复制链接

扫一扫

专栏目录