SVM的损失函数和对偶问题中的Slater条件,KKT条件

最新推荐文章于 2023-09-12 14:26:35 发布

Ioners

最新推荐文章于 2023-09-12 14:26:35 发布

阅读量899

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/Ioners/article/details/103021096

版权

机器学习专栏收录该内容

7 篇文章 1 订阅

订阅专栏

折页损失函数(Hinge Loss)

在机器学习中，**hinge loss作为损失函数(loss function)，通常被用于最大间隔算法(maximum-margin )，而最大间隔算法又是支持向量机(support vector machines)中用到的重要算法。
在这里插入图片描述
Hinge Loss的叫法来源于其损失函数的图形，为一个折线，通用的函数表达式为： $L(m_i) = \max(0, 1-m_i(w))$ 表示如果被分到正类，损失是0，否则损失就是 $1-m_i(w)$ 。
在机器学习中，Hing 可以用来解间距最大化的问题，最有代表性的就是SVM 问题，最初的SVM 优化函数如下： $\arg \min \frac{1}{2}\begin{Vmatrix} w \end{Vmatrix}^2 + C\sum_{i}\zeta_i$ $s.t.\quad \forall y_iw^Tx_i \ge 1 - \zeta_i$ $\zeta_i \ge 0$ 将约束项进行变形，则为： $\zeta_i \ge 1 - y_iw^Tx_i$ 则损失函数可以进一步写为： $\begin{aligned} J(w)&=\frac{1}{2}\begin{Vmatrix} w \end{Vmatrix}^2 + C\sum_{i}\max(0, 1-y_iw^Tx_i)\\ &=\frac{1}{2}\begin{Vmatrix} w \end{Vmatrix}^2 + C\sum_{i}\max(0, 1-m_i(w_i))\\ &=\frac{1}{2}\begin{Vmatrix} w \end{Vmatrix}^2 + C\sum_{i}L_{Hinge}(m_i) \end{aligned}$ 因此，SVM 的损失函数可以看作是L2-norm和Hinge loss之和。

KKT条件

KKT条件是解决最优化问题的时用到的一种方法。我们这里提到的最优化问题通常是指对于给定的某一函数，求其在指定作用域上的全局最小值。提到KKT条件一般会附带的提一下拉格朗日乘子。对学过高等数学的人来说比较拉格朗日乘子应该会有些印象。二者均是求解最优化问题的方法，不同之处在于应用的情形不同。
一般情况下，最优化问题会碰到一下三种情况：