李航《统计学习方法》第二版-第2章感知机浅见

最新推荐文章于 2022-10-20 15:15:18 发布

王伟王胖胖

最新推荐文章于 2022-10-20 15:15:18 发布

阅读量308

点赞数

分类专栏：机器学习李航统计学习方法第二版浅见文章标签：李航《统计学习方法》第二版-第2章感知机统计学习方法感知机机器学习统计学习

本文链接：https://blog.csdn.net/wangwei19871103/article/details/96871159

版权

机器学习同时被 2 个专栏收录

33 篇文章 3 订阅

订阅专栏

李航统计学习方法第二版浅见

5 篇文章 2 订阅

订阅专栏

李航《统计学习方法》第二版-第2章感知机浅见

2.1 感知机模型
2.2 感知机学习策略
2.3 感知机学习方法
- 总结

2.1 感知机模型

感知机是二分类线性模型，输入为实例的特征向量，输出为类别，-1和1。

目的是求出将数据分离的超平面，基于误分类的损失函数，用梯度下降法进行最小化，求得感知机模型。

感知机的定义简单就是输入空间X，输出Y={1,-1}。即:
$f(x)=sign(w\cdot x+b)$
w叫权重，就是影响程度，b叫偏置，就是修正偏差用的。其实后面更新的就这两个参数，w就是斜率，旋转多少，w就是平移多少，sign是符号函数，即：
$sign(x)=\left\{ \begin{aligned} &+1,x \geq 0 \\ &-1 ,< 0 \\ \end{aligned} \right.$

线性方程 $w\cdot x+b=0$ 对应于特征空间的一个超平面，w是法向量，b是截距。二维就是一条线将样本分成两类，三维空间就是一个平面分割成两部分。简单可以如图所示：
在这里插入图片描述

2.2 感知机学习策略

我们应该选择怎么样的感知机呢，就是要定个损失函数。我们当然希望能够分清所有的样本，没有偏差，所以损失函数可以定义成有偏差，就是某个样本到超平面的距离，首先要先选出分类分错的样本，即做 $x_i,y_i)$ ，则分错就是真实的类别和错分的类别相反了，也就是相乘是<0。所以可以是这样:
$-y_i(w\cdot x_i+b)>0$
即真实的和预测的结果异号。因此到超平面的距离是： $-{\frac {1} {||w||}y_i(w\cdot x_i+b)}$

这样所有分类错的点的集合设为M，到超平面的总距离为: $-\frac{1}{||w||} \sum_{x_i \in M} y_i(w\cdot x_i+b)$

不考虑 $\frac {1} {||w||}$ ,这个是常数，就得可以得到感知机学习的损失函数。

对于给定训练集 $T={(x_1,y_1),(x_2,y_2),...,(x_N,y_N)}$
其中 $x_i \in X=R^n$ , $y_i\in Y=\{1,-1\}$ ， $i = 1, 2, . ., N$ 。则损失函数定义为:
$\sum_{x_i \in M} y_i(w\cdot x_i+b)$
其中M为分类错误点的集合。

2.3 感知机学习方法

当然采用梯度下降法啦，而且是随机梯度下降法，每次随机选一个错分类的点来进行梯度下降，损失函数的梯度由:
$\nabla_wL(w,b)=-\sum_{x_i \in M} y_ix_i$
$\nabla_bL(w,b)=-\sum_{x_i \in M} y_i$
给出。

随机选取一个错分类点 $x_i,y_i)$ ,对w，b进行更新：
$\leftarrow w+\eta y_ix_i$
$\leftarrow b+\eta y_i$

其中 $\eta$ 是步长，也就是学习率，这样就不断的进行，使得最后损失函数不断减小，直到为0。

基本算法就是:
1.选取初值 $w_0,b_0$ ;
2.在训练集上选取数据 $x_i,y_i)$ ;
3.如果 ${\frac {1} {||w||}y_i(w\cdot x_i+b)} \leq0$ ,
$\leftarrow w+\eta y_ix_i$
$\leftarrow b+\eta y_i$
4.转至2，直至训练集中没有错分类的.

很容易理解，就不多说了。做实验会发现，采取不同的初值或者选取不同的错分类点，解可以不同，并且该算法也右收敛性的理论证明，具体可以去看书，我就不写了，因为写了大多人也不会看的哈哈。

还有中算法就是叫对偶形式，名字比较奇怪，其实因为是收敛的，那必定是有限次更新可以完成，所以可以写出训练集之间内积的形式，而且内积可以服用，存在一个矩阵里，其他原理和上面的算法一样。

总结

感知就模型就是二分类的线性模型，利用梯度下降法将错分类降到最低。

好了，今天就到这里了，希望对学习理解有帮助，大神看见勿喷，仅为自己的学习理解，能力有限，请多包涵，部分图片来自网络,侵删。

王伟王胖胖

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
李航《统计学习方法》第二版-第2章感知机浅见

李航《统计学习方法》第二版-第二章感知机浅见2.1 感知机模型2.2 感知机学习策略2.3 感知机学习方法总结2.1 感知机模型感知机是二分类线性模型，输入为实例的特征向量，输出为类别，-1和1。目的是求出将数据分离的超平面，基于误分类的损失函数，用梯度下降法进行最小化，求得感知机模型。感知机的定义简单就是输入空间X，输出Y={1,-1}。即:f(x)=sign(w⋅x+b)f(x)...
复制链接

扫一扫