吴恩达机器学习——支持向量机SVM（9）

最新推荐文章于 2023-09-05 11:11:45 发布

翔燕

最新推荐文章于 2023-09-05 11:11:45 发布

阅读量4.7k

点赞数

分类专栏：机器学习--吴恩达文章标签：吴恩达机器学习支持向量机

本文链接：https://blog.csdn.net/qq_36217665/article/details/99312463

版权

机器学习--吴恩达专栏收录该内容

14 篇文章 1 订阅

订阅专栏

1. 代价函数

在这里插入图片描述
其中： $C=\frac{1}{λ}$ ； $cost_0 = -log(1- \frac{1}{1+e^{-z}})== -log(1- \frac{1}{1+e^{-θ^Tx}})$ ; $cost_1 = -log(1\frac{1}{1+e^{-z}})== -log( \frac{1}{1+e^{-θ^Tx}})$

2. 最大间隔

在这里插入图片描述
在支持向量机中，希望分类的阀值不再是0，而是±1，使得中间有足够大的间隙，或者说安全的间距因子。如下：
$\begin{cases} 1, & \text { if $θ^Tx$ ≥ 1 (not just ≥ 0)} \\ 0, & \text{ if $θ^Tx$ ≤ -1 (not just < 0)} \end{cases}$
现在假设C是一个非常大的情况下, 最小化代价函数，那么就得有第一项为0。需要保证当y＝1的时候θTx≥1或者当y＝0的时候θTx≤－1。在此约束下，优化问题就变成了：
$\min_{θ} \frac{1}{2}\sum_{i=1}^n θ_j^2 s.t. \begin{cases} θ^Tx≥ 1, & \text { if $y^{(i)}$ = 1} \\ θ^Tx≤ -1, & \text{ if $y^{(i)}$ =0 } \end{cases}$
在这里插入图片描述
在图中分别画出三条决策边界，均可以将正样本和负样本分开，黑线看起来是更稳健的决策界。在分离正样本和负样本上它显得的更好。数学上来讲，这条黑线有更大的距离，这个距离叫做间距(margin)。
因此支持向量机有时被称为大间距分类器
当C非常大的时候，SVM容易收到异常点的影响，得到更好的决策界。
? 较大时，相当于 ? 较小，可能会导致过拟合，高方差。
? 较小时，相当于 ? 较大，可能会导致低拟合，高偏差。
在这里插入图片描述
支持向量机做的全部事情，就是极小化参数向量?范数的平方，或者说长度的平方。

3. 核函数

给定一个训练实例? ,利用? 的各个特征与预先选定的地标(landmarks)?⁽¹⁾, ?⁽²⁾, ?⁽³⁾的近似程度来选取新的特征?₁, ?₂, ?₃。
在这里插入图片描述 ??????????(?, ?⁽¹⁾)就是核函数，这个核函数为高斯核函数(Gaussian Kernel)。（注：这个函数与正态分布没什么实际上的关系）
地标的作用：实例?与地标?之间的距离近似于0，则新特征 ?近似于?−0 = 1，如实例?与地标?之间距离较远，则?近似于等于 0。

假设训练实例含有两个特征[?1 ?2]，给定地标?⁽¹⁾与不同的?值，见下图：

在这里插入图片描述可以看出，只有当?与?⁽¹⁾重合时?才具有最大值。随着?的改变?值改变的速率受到?²控制。
可使用现有的软件包（如liblinear,libsvm 等）最小化支持向量机的代价函数。在使用这些软件包之前，需要编写核函数，使用高斯核函数之前需要特征缩放。
另外，支持向量机也可以不使用核函数，不使用核函数又称为线性核函数(linear kernel)。