svm保姆级教程---（二）拉格朗日乘子算法求解的原理以及KKT条件

han_77777

于 2023-10-21 21:46:02 发布

阅读量520

点赞数 1

文章标签：支持向量机算法机器学习 svm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45651883/article/details/133964502

版权

接上文，我们可以知道软硬间隔下的svm表达式，是一个约束最优化问题。

在约束最优化问题中，常常利用拉格朗日对偶性(Lagrange duality)将原始问题转为对偶问题，通过解决对偶问题而得到原始问题的解。

下面我们先回忆一下拉格朗日乘子算法求解的原理以及大名鼎鼎的KKT条件（这里我参考了李宏毅老师的ppt）

首先我们设置原始问题:

我们将上述问题对应的图像画出，可以看出梯度的反方向为蓝色箭头的方向

同时我们做出的梯度方向，因为梯度的方向是指向函数值增大最快的方向，的函数值可以不严谨的理解为圆的半径，因此梯度方向超外。

现在我们来看图像，首先我们看图上的红点要想实现原式的条件，红点必须在图上（即圆上），且红点移动的方向要与的夹角小于90°。

由图像可以得出，当与同向时将达到最小值，因此可以得出，即，可以取得极小值。

下面我们尝试将原问题转化为以下形式，即将转化为

你会发现当对求极值时，在关于求偏导得到，在关于求偏导得到。可以看到①、②两个式子涵盖了我们上面说的原问题最小值及其相应条件（ps：要想实现求得的是局部极小值，也就是保证是函数图像的波谷，还必须要求梯度的梯度矩阵必须是正定矩阵，有兴趣的朋友可以自行百度，我这里就不赘述了）。以上就是拉格朗日乘子算法的本质。

下面我们来看在条件为不等式的情况，

第一种情况

我们还是先把图像画出来

可以看到当的极小值无论是否有的约束，的极小值都是原来那个值，也就是说没有起到作用。

因此在此类情况下，当，就可以取到极小值，同时我们还可以知道，此时。

第二种情况

由图上可知，此时因为的最小值没有在可行区域内，因此的极小值必定在的边界上，设极优解为，故可得出。由上文及下图可知当满足，即可得到极小值的一系列点，又因为该点必须在的边界上，故可以得出唯一的最优解。即当，且时，即可取得极优解。

现在我们将以上两种情况总结归纳一下，

作为极优解，其中第一种情况：

上式可以等价于

其中第二种情况：

现在我们设置拉格朗日函数：

原函数

对应的

其极小值对应的极优解、应满足以下式子：

其中①式为，对lagrangian关于求偏导，即为：。

我们将上文两种情况归纳总结，可以看到上述两种情况其对应的、要满足一定关系，对应关系可以归纳写为③式，，这样一来就可限制死第一、二种的对应的相应条件。该式子又被称为松弛条件，可以看到当，一定存在，证明无约束，不对的极值起作用；当，一定存在，且一定位于的边界上。我们再看②、④显然成立。

上面的四个式子被称为KKT条件。

所谓的KKT条件就是说拉格朗日乘子算法求出的要想是最优解就必须满足KKT条件，否则就不是极优解。但反过来满足KKT条件的，不一定就是极优解。也就是说拉格朗日乘子算法求出的最优解是KKT条件的充分不必要条件。

以上就是拉格朗日乘子和KKT条件的全部内容，下面我们重返svm，进一步求解。请看svm保姆级教程---（三）svm中目标函数的拉格朗日形式

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
1
评论
svm保姆级教程---（二）拉格朗日乘子算法求解的原理以及KKT条件

局部极小值，也就是保证是函数图像的波谷，还必须要求梯度的梯度矩阵必须是正定矩阵，有兴趣的朋友可以自行百度，我这里就不赘述了）。在约束最优化问题中，常常利用拉格朗日对偶性(Lagrange duality)将原始问题转为对偶问题，通过解决对偶问题而得到原始问题的解。所谓的KKT条件就是说拉格朗日乘子算法求出的要想是最优解就必须满足KKT条件，否则就不是极优解。，不一定就是极优解。现在我们来看图像，首先我们看图上的红点要想实现原式的条件，红点必须在。的梯度方向，因为梯度的方向是指向函数值增大最快的方向，
复制链接

扫一扫

han_77777 CSDN认证博客专家 CSDN认证企业博客

码龄5年

6: 原创

165万+: 周排名

15万+: 总排名

2443: 访问

: 等级

73: 积分

16: 粉丝

11: 获赞

1: 评论

18: 收藏

私信

关注

热门文章

最新评论

svm保姆级教程---（一）基本表达式
CSDN-Ada助手: 恭喜您撰写了第一篇博客！标题“svm保姆级教程---（一）基本表达式”非常吸引人，很高兴看到您开始博客创作。您的文章内容非常有潜力，对于初学者来说，一个清晰易懂的教程是非常重要的。下一步，我建议您可以进一步扩展文章内容，例如给出更多实际案例或是提供一些实用的代码示例，这将帮助读者更好地理解SVM的基本表达式。祝愿您在博客创作的旅程中越来越进步！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
svm保姆级教程---（五）终极求解 smo算法（完结篇）
CSDN-Ada助手: 非常棒的博文！你对SVM的讲解非常清晰和详细，让我对SMO算法有了更深入的理解。我非常鼓励你继续写作，分享更多关于机器学习的知识。除了你提到的凸优化算法，还有一些与SVM相关的扩展知识和技能。例如，你可以了解一下核函数，它可以将SVM应用于非线性分类问题。另外，你也可以学习一些调参技巧，如如何选择合适的惩罚参数C和核函数参数。这些内容可以进一步丰富你的博文，并帮助读者更好地理解和应用SVM算法。期待你的下一篇博文，继续努力！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
svm保姆级教程---（四）核技巧与线性不可分
CSDN-Ada助手: 恭喜您写了第三篇博客！标题看起来很有趣，我很期待阅读这篇关于SVM的教程。核技巧与线性不可分是一个非常重要的主题，我相信您会给我们带来很多有关SVM的深入见解。希望您能够继续保持创作的热情，并且不断提供有关机器学习的知识分享。在下一步的创作中，或许您可以考虑深入探讨SVM在实际问题中的应用案例，这将进一步丰富读者的学习经验。再次恭喜您的成果，期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
svm保姆级教程---（三）svm中目标函数的拉格朗日形式
CSDN-Ada助手: 恭喜您写了第四篇博客！标题看起来非常有趣，我很期待阅读您对SVM中目标函数的拉格朗日形式的解析。您的博客一直以来都很有深度和专业性，我很感谢您和我这样的读者分享这些知识。如果可以的话，我希望您在下一篇博客中能够进一步探讨SVM的实际应用案例，这将使我们更好地理解这个主题。再次感谢您的辛勤努力，期待您的下一篇精彩文章！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
svm保姆级教程---（二）拉格朗日乘子算法求解的原理以及KKT条件
CSDN-Ada助手: 恭喜博主写了这么有深度的博客！标题中的拉格朗日乘子算法求解原理以及KKT条件是SVM中非常重要的概念，您的解释非常清晰易懂。我希望您能继续深入讲解SVM的相关理论，并结合实际案例进行分析，这样读者能更好地理解和应用这个算法。再次感谢您的分享，期待您下一篇博客的发布！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

han_77777 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。