机器学习总结系列（二）——感知机模型

最新推荐文章于 2022-08-25 15:13:37 发布

芳草碧连天lc

最新推荐文章于 2022-08-25 15:13:37 发布

阅读量1.2k

点赞数 1

分类专栏：机器学习总结系列文章标签：机器学习统计学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leichaoaizhaojie/article/details/52992873

版权

机器学习总结系列专栏收录该内容

1 篇文章 0 订阅

订阅专栏

机器学习总结系列（二）——感知机模型

　　本文主要介绍第二个比较重要的模型——感知机模型，感知机模型在李航老师《统计学习方法》中有专门一章来具体介绍，但是周志华老师的《机器学习》是在神经网络一章中简单提到，而机器学习实战中则没有提到。所以我在这主要以《统计学习方法》中的内容为参考，进行描述。
　　

目录

机器学习总结系列二感知机模型

1. 感知机模型介绍

感知机是二类分类的线性分类模型，输入：实例的特征向量；输出：实例的类别。感知机对应于输入空间（特征空间）中将实例划分为正负两类的分离超平面，旨在求出将训练数据进行线性划分的分离超平面。

2. 感知机模型

　　由输入空间到输出空间的函数如下（有一些描述和限制条件我就不写了，想详细了解可以参考《统计学习方法》）：

f (x) = s i g n (w \cdot x + b)

$f\left ( x \right )= sign\left ( w\cdot x+ b \right )$

s i g n (x) = {+ 1, x \geq 0 - 1, x < 0

$sign\left ( x \right ) = \left\{\begin{matrix} &+1,x\geq 0\\ &-1,x< 0 \end{matrix}\right.$
感知机模型的假设空间是定义在特征空间中的所以线性分类模型，或者线性分类器。

3.感知机学习策略

先了解一个概念——数据集的线性可分性：存在超平面，能够将数据集中所有的正例点和负例点完全正确地分到超平面两侧，这样的数据集称为线性可分数据集。

损失函数

如果定义误分类点的总数，那么这个损失函数不是参数 $w$ 和 $b$ 的连续可导函数，不易优化。另一个选择是误差函数定义为误分类点到分类平面的距离之和。这样假设误分类点的集合是 $M$ ,那么损失函数定义为：

- 1 ∥ w ∥ \sum x i ϵ M y i (w \cdot x i + b)

$-\frac{1}{\left \| w \right \|} \sum_{x_{i}\epsilon M}^{ }y_{i}\left (w\cdot\ x_{i}+b\right )$
不考虑

1∥w∥ $\frac{1}{\left \| w \right \|}$ 的影响，就得到了感知机学习的损失函数了。

4. 感知机学习算法

学习算法就是求解最优化问题，方法是梯度下降法。

原始形式

感知机学习算法是误差驱动的，使用随机梯度下降法。

首先选择任意的一个超平面，即初始化 $w_{0}$ 和 $b_{0}$ ;
在训练集中任意选取一个数据 $\left ( x_{i},y_{i} \right )$ ；
如果

$y i (w \cdot x i + b) ⩽ 0$ $y_{i}\left (w\cdot\ x_{i}+b\right )\leqslant 0$
则
$ω = ω + η y i x i$ $\omega = \omega +\eta y_{i}x_{i}$
$b = b + η y i$ $b= b +\eta y_{i}$
转至2，直到没有误分类点为止。

对偶形式

对偶形式是感知机学习的另一种思路，它将参数定义为了每一个样例点修改次数的增量，推到过程比较好。由于公示实在是比较难打，建议看书了解。

证明数据线性可分条件下感知机学习算法的收敛性

这一部分主要是讲解为什么通过有限次的迭代，就能找到一个合适的超平面将两类分开。这部分是证明，比较繁琐，有兴趣可以查看数据。但是一定要记住，收敛的条件是数据集是线性可分的。

总结

感知机这部分主要在《统计机器学习》中有讲，而在周志华的机器学习中是在神经网络中讲解的。他是将感知器理解为一个神经元，但是这种神经元一层是不能进行非线性可分的分类的，比如取异或，必须是两层。这样就引出了用Sigmoid函数作为神经元。

芳草碧连天lc

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。