机器学习基础（七）—支持向量机

最新推荐文章于 2024-07-04 11:22:15 发布

Arvin Ou

最新推荐文章于 2024-07-04 11:22:15 发布

阅读量919

点赞数 1

分类专栏：机器学习基础文章标签：深度学习神经网络机器学习数据挖掘 python

本文链接：https://blog.csdn.net/weixin_44027006/article/details/124079252

版权

16 篇文章 2 订阅

订阅专栏

在SVM当中，cost代替了log项，图像和log项的图像非常相似。
在这里插入图片描述

在SVM中，我们优化不再使用λ，而是使用C，C这一项是被放到了前面的一项当中，并且1/m被去除。
在这里插入图片描述

在支持向量机当中，为了使我们的代价函数最小：

在这里插入图片描述

下图中的上面的坐标轴：

向量u的长度就等于根号u_1²+u_2²（勾股定理）。而向量v的长度也可以同理得到。通过箭头v做垂直于u的直线，p就是v在u上的映射。那么u.T * v=p*u。
当p<90°时呢，我们的p是为正数的。
当p>90°时呢，我们的p此时就是负数。

假设左图的绿色线为决策边界（支持向量机不会选择这条线）。利用向量内积的原理，我们可以绘制出两个样本在θ上的映射，可以看到此时p⁽¹⁾是一个很小的数，p⁽²⁾为负数。那么如果要满足p⁽ⁱ⁾* ||θ||>=1或p⁽ⁱ⁾*||θ||，那么我们就要尽可能的使||θ||大。那么如果||θ||大了，那就和优化项的1/2 * ||θ²||要尽量小就冲突了。所以支持向量机不会选择这头条决策边界。
若选择这条绿色决策边界，我们的P就会变大，从而使得我们的θ变小，而为了使θ尽量的小，我们的SVM会找到一个间距，这个间距会使得P尽可能的大，最终目的还是为了使得θ可以尽可能的小。

当我们需要对高阶项进行计算时，会耗费相当大的计算量，因此这里我们使用核函数来近似。
x与的相似核函数表示如下：

在这里插入图片描述

假设我们现在有三个变量，f1,f2,f3对应的相似值landmarks分别为l(1),l(2),l(3)。参数θ1，θ2，θ3已知，当我们的真实样本为玫红色时，可见真实样本与l(1)离的非常近，与l(2),l(3)离的非常的远。因此，这是f1会非常的接近于1，而f2、f3会非常的接近于0，所以此时我们带入可求得我们的值是0.5>=0.5，所以预测值会为1。
同样的道理，当我们的实际值离这三个点都非常远的时候，我们的预测值就变成了θ0。
又因为我们的θ3是0，所以仅当实际值在红色线区域内我们的预测值才会为1（这样就可以得出我们的决策边界）

如何选择landmark:
看下图中位于下半部分的两幅图。左边的一幅图是我们的给出的样本所在的位置，我们在每个样本点对应的位置放上一个landmark，然后组成一个向量。
比如所我们取x⁽ⁱ⁾,那么我们就会得到f⁽ⁱ⁾_1、f⁽ⁱ⁾_2、…、f⁽ⁱ⁾_m。每一个f⁽ⁱ⁾_j，都表示不同样本点与x⁽ⁱ⁾的距离。所以当到f⁽ⁱ⁾_i的时候也就是在计算x⁽ⁱ⁾与自身的相似值，也就1。
然后将这些f⁽ⁱ⁾进行组合，我就创建了一个新的向量来描述我们的特征向量x⁽ⁱ⁾。

在这里插入图片描述

在这里插入图片描述

关注