SVM支持向量机系列理论（七）线性支持向量机与L2正则化 Platt模型

最新推荐文章于 2024-04-12 14:36:20 发布

知了不知蝉鸣惊

最新推荐文章于 2024-04-12 14:36:20 发布

阅读量1.8k

点赞数

分类专栏： SVM支持向量机系列理论

本文链接：https://blog.csdn.net/promisejia/article/details/81394649

版权

11 篇文章 7 订阅

订阅专栏

上一篇说到， $\xi_i$ 表示偏离边界的度量，若样本点 $(x_i,y_i)$ 满足约束时，则 $\xi_i =0$ ，当不满足约束时， $\xi_i =1 - y_i(w \cdot x_i + b)$ ,表示偏离margin的度量。

则把上面的合起来：

$\xi_i = max(0, 1 - y_i(w \cdot x_i + b))$
那么优化目标函数可以写为：

$min_{ \ w,b} \ \ \frac{1}{2}{||w||}^2 + C \sum_{i=1}^{N}max(0, 1 - y_i(w \cdot x_i + b)) \ \ \ \ \ \ \ \ (1)$

其中，我们把式子中的
$L_{hinge }= max( \ 1-z \ , \ 0)$ 称为hinge合页损失函数。

我们可以看到 L2 正则化的合页损失函数可以等价于软间隔SVM。
但是，软间隔SVM的优势在于：

软间隔允许某些样本不满足约束
$\ \ \ y_i{(w \cdot x_i + b )}{} \geq {1};$ ，而且我们希望在最大化间隔时，不满足约束的样本尽可能少。

那么优化目标函数可以写为：

$min_{ \ w,b} \ \ \frac{1}{2}{||w||}^2 + C \sum_{i=1}^{N} L_{0/1}(y_i(w \cdot x_i+b)-1)\ \ \ \ \ \ \ \ (2)$

C 为无穷大时，迫使所有样本满足约束，C为有限值时，允许一些样本不满足约束。

其中， $L_{0/1}$ 是0-1损失函数，代表当不满足约束时，记为 1. 但是，0-1损失函数是非凸非连续函数，数学性质不好，通常使用凸函数且是0-1损失函数的上界来代替损失函数：

使用

那么，软间隔SVM可以视为一个加L2正则化的模型。

针对（2）,如果将0-1损失函数 $L_{0/1}$ 替换成对数损失函数 $L_{log}$ (也就是极大似然函数),那么就几乎得到了逻辑回归模型（周志华《机器学习》P57）。

实际上，支持向量机和逻辑回归的优化目标相近，性能也相当。

逻辑回归的优势：

SVM的优势：

这样就能把SVM的结果转化成概率。

关注