机器学习09-偏差、方差、SVM

最新推荐文章于 2022-07-27 13:08:58 发布

猛男在线敲代码

最新推荐文章于 2022-07-27 13:08:58 发布

阅读量365

点赞数 1

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/qq_43591530/article/details/120282369

版权

机器学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

偏差、方差

在这里插入图片描述

SVM

在这里插入图片描述

优化目标

我们先从Logistic回归说起，我们知道在Logistic回归中，Sigmoid函数的作用 $z=\theta^Tx$ ，如果我们需要让y = 1，那我们就想要 $h(x)\approx1$ 。下面我们为远大于和远小于划定一定的界限，首先我们还是以代价函数的例子来说明，我们之前定义了：

[公式]

我们分别画出当y=0,1时的函数图像：

在这里插入图片描述

我们可以很明显地看出当y = 1,z>1时，代价z就差不多变成0了，反之则是z<-1。这里注意一下，关于1和-1，基本是我们约定俗成的，请大家不用过分在意。于是我们得到了新的代价，在机器学习，我们把它成为支持向量：

[公式]

下面我们重写SVM的整体代价函数，我们加入了正则项，并与logistic作对比：

[公式]

我们可以看出SVM中有一个常数C，没有关系，你可以把他当做和正则化参数一样的东西，用于调整权重的比例，防止过拟合的问题。这就是SVM的优化目标，即代价函数。

大间隔学习

支持向量机还有一个名称，就是大间隔学习，下面我会用可视化的方式来告诉你为何它是大间隔学习，以及为何它的效果要优于我们的Logistic回归。假设我们有一个二分类的样本，如下图所示：
在这里插入图片描述

在这里分类问题中，L1和L2是我们Logsitic回归可能得到的决策界限，可以看出的是，虽然这两条直线，确实分开了两个样本，但是分类效果并不太好。而支持向量机划分的决策界限，则是S1，其中S2和S3为初始划定界限，最终选择S1作为决策界限，而S1与S2、S3的距离被称为Margin。

核函数

其实核函数核方法这些东西在所有的模型算法中都能应用到，但是其在SVM中的效果明显，所以核函数常常后来和SVM一起出现。我们在解决非线性问题的时候，常常会为假设函数的选择而困扰，选择单变量一次项 $x_1$ ，还是单变量高次项 $x_1^n$ ，还是选择多变量的积 $x_1x_2x_3$ ，这常常会给我们的分类问题的解决造成障碍，于是我们可以得到一个较为统一的式子：