统计学习方法（第二章）感知机

最新推荐文章于 2022-08-25 16:20:11 发布

misaiya1

最新推荐文章于 2022-08-25 16:20:11 发布

阅读量280

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/misaiya1/article/details/78703003

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1 什么是感知机

在机器学习中，感知机（perceptron）是二分类的线性分类模型，属于监督学习算法。输入为实例的特征向量，输出为实例的类别（取+1和-1）。感知机对应于输入空间中将实例划分为两类的分离超平面。感知机旨在求出该超平面，为求得超平面导入了基于误分类的损失函数，利用梯度下降法对损失函数进行最优化（最优化）。感知机的学习算法具有简单而易于实现的优点，分为原始形式和对偶形式。感知机预测是用学习得到的感知机模型对新的实例进行预测的，因此属于判别模型。感知机由Rosenblatt于1957年提出的，是神经网络和支持向量机的基础。输入X表示实例的特征向量，对应输入空间的点，输出空间Y表示实例的类别，属兔空间到输出空间的函数，称为感知机。

感知机是在输入空间中将实例划分为两类的超平面，感知机是判别模型。

感知机是神经网络和支持向量机（SVM）的基础，表达式如下：

sign是符号函数：

在二分类问题中f(x)等于+1 表示正例，f(x)等于-1表示负例。线性方程wx+b=0（直线，平面，超平面）可以分离正例和负例，如所示：

2 感知机的损失函数定义

1）自然选择：误分类的点的数目（不是w和b的函数，难以用来优化w和b）

2）误分类的点到超平面的距离和

|wx +b|（函数距离，可以衡量相对距离）

（几何距离）

因为正例y值为1 负例y值为-1，所以所有正确的划分：

错误的划分上式的值为负，

误分类到超平面的距离为

不考虑||w||，得到的误差函数为：

这个损失函数就是感知机学习的经验风险函数。

这样，分类问题转化成求L函数的最优化问题。

2 感知机的学习策略

最优化的方法是随机梯度下降法（stochastic gradient descent）。简单的说，SGD是误分类驱动的就是随机初始化W0和b0，使用梯度下降法不断地最小化目标函数，即：

通过计算梯度（偏导数）来更新W和b,n是步长学习率，也就是更新的步长，通过不断的迭代，将误差下降为0，此后，w和b将不会改变（因为是误分类驱动的），分类模型稳定。

η

实例

正样本点： x1=(3,3)T , x2=(4,3)T
负样本点： x1=(1,1)T

求感知机模型f(x)=(wx+b) 其中 w=（w1，w2），

解答思路：根据上面讲解的，写初始化权值w和偏置b，然后一步一步的更新权值，直到所有的点都分正确为止。

解：

（1）令 w0=0,b0=0
（2）随机的取一个点，x1

未正确分类。更新w0--> w1=w0+ny1x1,b1=b0+ny1

同理计算，最后得到w=（1,1）b=-3

yi(

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法（第二章）感知机

1 什么是感知机在机器学习中，感知机（perceptron）是二分类的线性分类模型，属于监督学习算法。输入为实例的特征向量，输出为实例的类别（取+1和-1）。感知机对应于输入空间中将实例划分为两类的分离超平面。感知机旨在求出该超平面，为求得超平面导入了基于误分类的损失函数，利用梯度下降法对损失函数进行最优化（最优化）。感知机的学习算法具有简单而易于实现的优点，分为原始形式和对偶形式。感知
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。