机器学习：支持向量机(SVM)与Python实现第(二)篇

最新推荐文章于 2024-07-04 20:12:01 发布

Webbley

最新推荐文章于 2024-07-04 20:12:01 发布

阅读量2.8k

点赞数 4

分类专栏： Machine Learning 文章标签：机器学习 svm KKT条件拉格朗日乘子 python

本文链接：https://blog.csdn.net/liweibin1994/article/details/77511628

版权

本文是关于支持向量机(SVM)的系列博客第二篇，主要探讨使用拉格朗日乘子法简化SVM优化问题，介绍KKT条件，并讨论了优化间隔分类器的概念。通过拉格朗日函数的构建，阐述了如何从原始问题转换到对偶问题，为后续的非线性分类和核函数奠定基础。

摘要由CSDN通过智能技术生成

前言

最近看了Andrew Ng的机器学习视频中的支持向量机，视频的内容比较浅显，没有深入解释支持向量机中的数学原理。但是对于一个比较执着于知道为什么的人，笔者还是去网上查找了有关支持向量机原理以及实现的相关资料。在查找的过程中，笔者发现支持向量机的内容还是蛮多的，于是笔者根据自己的理解，并且参考了一些相关资料，最终写下了支持向量机的四篇博客。
机器学习：支持向量机(SVM)与Python实现第(一)篇——此篇主要介绍了分类间隔，引入SVM。
机器学习：支持向量机(SVM)与Python实现第(二)篇——此篇主要介绍了使用拉格朗日乘子来简化SVM问题的优化。
机器学习：支持向量机(SVM)与Python实现第(三)篇——此篇主要介绍非线性分类(核函数)以及松弛变量。
机器学习：支持向量机(SVM)与Python实现第(四)篇——此篇主要介绍SMO算法并用python实现了简单的SVM分类器。

上一节经过我们的推导，最终把问题变成：

m i n γ, w, b 1 2 ∥ w ∥ 2 s . t . y (i) (w T x (i) + b) \geq 1, i = 1, . . ., m

$\begin{aligned} & \underset{\gamma,w,b}{min} \ \frac{1}{2}\left \| w \right \|^2\\ &s.t.\ \ y^{(i)}(w^{T}x^{(i)}+b)\geq 1,\ i=1,...,m \end{aligned}$
接下来我们就要来看看如何来高效解决这个问题。

拉格朗日对偶性

首先我们先暂时放下SVM和最大间隔分类器，而来谈谈如何解决含有限制的优化问题。这种问题的一般形式是：

m i n w f (w) s . t . h i (w) = 0, i = 1, . . ., l

$\begin{aligned} & \underset{w}{min} \ f(w)\\ &s.t.\ \ h_{i}(w)=0,\ i=1,...,l \end{aligned}$
对于这种问题，一般我们使用拉格朗日乘子( 对拉格朗日乘子的理解请参考)来解决，即我们定义：

L (w, β) = f (w) + \sum i = 1 l β i h i (w)

$L (w,\beta)=f(w)+\sum_{i=1}^{l}\beta_{i}h_{i}(w)$ 其中，

βi $\beta_i$ 叫做拉格朗日乘子。
接下来我们对

L(w,β) $L(w,\beta)$ 求偏导，并且令偏导数为0：

\partial L \partial w i = 0; \partial L \partial β i = 0

$\frac{\partial L}{\partial w_i}=0;\ \frac{\partial L}{\partial \beta_i}=0$ 这样就可以求解出w和

β $\beta$ 了。

上面列举的限制条件是等式的情况，有时候限制条件是不等式。考虑下面的原始优化问题：

m i n w f (w) s . t . g i (w) \leq 0, i = 1, . . ., k h i (w) = 0, i = 1, . . ., l (1)

$\begin{aligned} & \underset{w}{min} \ f(w)\\ &s.t.\ \ g_i(w)\leq 0,\ i=1,...,k\\ &h_{i}(w)=0,\ i=1,...,l \end{aligned}\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ (1)$ 为了求解出这个问题，我们可以定义下面的泛化拉格朗日函数：

L (w, α, β) = f (w) + \sum i = 1 k α i g i (w) + \sum i = 1 l β i h i (w)

$L (w,\alpha,\beta)=f(w)+\sum_{i=1}^{k}\alpha_{i}g_{i}(w)+\sum_{i=1}^{l}\beta_{i}h_{i}(w)$ 其中，

α和β $\alpha和\beta$ 叫做拉格朗日乘子。

接下来详细推导一下KKT条件：

h i (w) = 0 \Rightarrow L (w, α, β) = f (w) + \sum i = 1 k α i g i (w) ∵ α i \geq 0 g i (w) \leq 0} \Rightarrow \sum i = 1 k α i g i (w) \leq 0 ∴ m a x α L (w, α, β) = f (w) (2) ∴ m i n w f (w) = m i n w

最低0.47元/天解锁文章

Webbley

关注

4
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
机器学习：支持向量机(SVM)与Python实现第(二)篇

上一节经过我们的推导，最终把问题变成： minγ,w,b 12∥w∥2s.t. y(i)(wTx(i)+b)≥1, i=1,...,m\begin{aligned}& \underset{\gamma,w,b}{min} \ \frac{1}{2}\left \| w \right \|^2\\&s.t.\ \ y^{(i)}(w^{T}x^{(i)}+b)\geq 1,\ i=1,...,
复制链接

扫一扫

专栏目录