【机器学习】感知机、线性支持向量机

想变厉害的大白菜

已于 2022-03-17 20:59:40 修改

阅读量1.2k

点赞数

分类专栏：机器学习文章标签：机器学习支持向量机算法

于 2022-03-17 17:06:29 首次发布

本文链接：https://blog.csdn.net/weixin_44211968/article/details/123554522

版权

机器学习专栏收录该内容

47 篇文章 55 订阅

订阅专栏

文章目录

一、感知机 - 线性二分类
二、感知机的损失函数
三、感知机实战：sklearn.linear_model.Perceptron
四、Linear SVM
参考链接

一、感知机 - 线性二分类

感知机是一种相对简单的 二分类 的线性分类模型，其输入为实例的特征向量，输出为实例的类别，取+1和-1二值。

感知机通过学习将训练数据进行线性划分的超平面，将整个输入空间空间分为正负两类，因而属于判别模型。

由输入空间到输出空间的如下函数:

称为感知机。其中， w ∈ R 叫做权值（weight）或权值向量（weight vector）， b ∈ R 叫做偏置（bias）。

具体地看，感知机是在没有基函数的线性回归上套了马甲。

其中sign是符号函数：

感知机算法应用的前提是假设数据集是线性可分的，而感知机算法也是在求得一个使得训练集正实例点和负实例点完全正确分开的分离超平面，清楚了感知机算法的分类函数以及它的假设，那么接下来的事情就是定义损失函数并使得损失函数最小化，以确定分类函数中的参数。

二、感知机的损失函数

损失函数的一个自然选择是 错误分类点的个数，只要使得误分类点的个数为零，就可以得到满足我们要求的一个分离超平面了，即：

0-1 loss简单直观，可惜它不是一个凸函数，不容易优化。感知机选择的是另一个损失函数：误分类点到分离超平面的距离之和 。我们知道空间中任一点到超平面的距离公式为：

对于误分类的数据来说，总有：

我们可以成比例地缩放参数而不改变分离超平面的位置，为方便计算我们可以将法向量的模置为 1 ，因而不考虑上述距离公式的分母，就得到感知机学习的损失函数为：

其中 M 为误分类点的集合。

有了可微的损失函数，那么随机梯度下降就可以逐步地调整分离超平面的位置，使之每一次梯度下降之后都朝着被选择的误分类点的方向移动，值得说明的是，这样的一次移动并不能保证一定使得误分类点的个数减少，有可能会增加，但是 Novikoff 定理保证对于线性可分的训练数据集，误分类的次数 k 是有上限的，也就是经过有限次的搜索可以找到将训练数据集完全正确分开的分离超平面，即感知机算法的随机梯度下降是收敛的，当然对于线性不可分的数据集，感知机算法不会收敛，迭代结果会一直发生震荡。

同样的我们要知道，由于初始参数值选择的不同以及随机梯度下降算法迭代过程中误分类点的选择不同，使得 感知机算法最后得到的分离超平面多种多样。为了得到唯一的分离超平面，就需要对其增加更多的约束条件，这也就是之后介绍的 线性SVM 的想法。