机器学习（十四）SVM总结

最新推荐文章于 2022-07-03 22:08:52 发布

lonelyrains

最新推荐文章于 2022-07-03 22:08:52 发布

阅读量1k

点赞数

分类专栏：机器学习机器学习文章标签：机器学习 svm 优化

本文链接：https://blog.csdn.net/lonelyrains/article/details/49509115

版权

机器学习同时被 2 个专栏收录

29 篇文章 0 订阅

订阅专栏

机器学习

24 篇文章 10 订阅

订阅专栏

SVM直观理解总结

本文由 @lonelyrains出品，转载请注明出处。
文章链接： http://blog.csdn.net/lonelyrains/article/details/49509115

1、SVM初衷是基于逻辑回归的线性简化（基础）

改变代价函数整体的常系数并不影响梯度调优时 $\Theta$ 矩阵的选取，所以修正一下 $\lambda$ ，并消掉了样本量 $m$ 的系数。
Sigmoid阈值计算比较麻烦，而且偏向0.5的时候难以说明情况好坏，所以优化为线性简化。如果y实际值为1，则希望 $\theta^Tx\ge1$ 而不仅仅是 $\theta^Tx\ge0$ ；反之希望 $\theta^Tx\le-1$ 。
故线性简化代价函数如下图：
将非线性阈值简化为线性阈值评价

2、SVM的LargeMargin边界（加工）

如何找到的是黑色分界线，而不是偏向正负样本两边的蓝色分界？如下图
LargeMargin
如果代价函数的前半部分为 $0$ ，则希望取 $min_{\Theta}\frac{1}{2}\sum_{j=0}^n\theta_j^2$ 。为了使|| $\theta$ ||比较小以取得较小的代价函数，同时为了 $\theta^Tx\gt\gt1$ 或者 $\theta^Tx\lt\lt-1$ 才能显示较强的区分性，所以希望 $x$ 到 $\theta$ 的投影比较大，从而使 $\theta$ 的垂直方向为边界。因为 $\theta_0 = 0$ ，所以能取到 $LargeMargin$ 。
如何找LargeMargin

3、SVM核函数（精髓）

线性不可分边界，如果纯粹用 $x^\rightarrow$ 的内部自变量的高维排列组合，会引起组合爆炸。如图：

为了简化问题，取样本核为每一个样本。直观上理解，即每一个样本，都对所有样本求一次相似度。相似度评价函数即核函数。理论上样本随机正态分布，为了相似度满足完全一致时取1，而不一致时接近于0，所以对随机正态分布做了简单的修改。
相似度核函数替换原自变量
然后再用这些样本核来做对应的降维后的线性代价函数的自变量，便得到了直观上与对所有 $x^\rightarrow$ 一致的效果。