感知机模型

最新推荐文章于 2024-04-24 11:17:59 发布

六个轱辘

最新推荐文章于 2024-04-24 11:17:59 发布

阅读量709

点赞数

分类专栏：机器学习文章标签：机器学习感知机

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tjy1220646144/article/details/45312813

版权

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

这里介绍机器学习中最简单的一种分类方法：感知机模型。

感知机模型：

其中sign是符号函数，w和b是参数，x是输入特征向量，f(x)返回决策结果。

分离超平面S：

对于二类线性可分问题，分离超平面将两类样本分在S两侧。

空间中一点x0到S的距离：

损失函数：

定义损失函数的意义是所有误分类的点到分离超平面的距离之和最小，如果是线性可分问题，则该距离之和为0。

设误分类的点的集合为M，某误分类点xm到S的距离为：

（样本有两类{1, -1}，仔细想一想就知道这个公式的含义了！）

所以可得损失函数（优化目标）为：

（注意||w||是常数省略）

梯度下降法求解w和b：

使用经典的梯度下降法求解最优化问题。

（一般梯度下降法有两种选择：批量梯度下降和随机梯度下降。批量梯度下降就是使用上述公式，可以得到全局最优解（也不一定哦），但是当数据量很大时，批量梯度下降会非常慢，因为每次迭代都要使用全部的数据进行计算；而相应的，随机梯度下降每次迭代只使用一个样本数据，速度快，但是不够鲁棒，不一定可以得到最优解。）

这里使用随机梯度下降的方案，即每次只使用一个样本对参数进行更新：

（注意：梯度的方向是求极大值，梯度的反方向是求极小值，这里是求极小值）

对于二类线性可分问题，上述随机梯度下降过程是可以证明收敛的，经过若干次迭代即可以求出分离超平面S，即决策函数。

感知机学习算法的对偶问题：

为什么要提感知机学习算法的对偶问题呢？因为感知机是SVM的基础，并且感知机学习算法和其对偶算法与SVM学习算法和其对偶算法有对应关系，感知机学习算法的对偶算法相对比较容易理解！

对偶算法的思想是：将w和b表示为实例xi和标记yi的线性组合的形式，通过求解其系数而求得w和b。

在上述随机梯度下降的迭代过程中，即：

如果令w和b的初值为0，则可以将最终w和b的值表示成以下形式：

其中，其中ni表示样本xi参与迭代的次数。所以决策函数可以表示为：

可以看出，只要求出a，就可以求出决策函数。

具体的感知机对偶学习算法如下：

（1）；

（2）在训练数据集中选取数据；

（3）如果，则；

（4）转（2），直到没有误分类的数据。

注意在（3）中出现的内积，这个内积的形式有很多神奇的功能，第一可以通过预处理求出所有样本的内积矩阵（Gram矩阵），这样在实际的迭代过程中就会节省一定的时间；第二该内积形式是SVM中植入核方法的基础！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄14年

22
原创

22
点赞

36
收藏

12
粉丝

关注

私信

热门文章

分类专栏

最新评论

如何判断双链表是否有环
weixin_40091363: 遍历链表判断当前节点的next.pre 是不是当前节点不可以么
MLE极大似然估计
花落知多少灬: 谢谢楼主，讲的非常清楚
使用KD树进行最近邻查找的例子
「已注销」: 关于kd树看看这篇文章吧说的非常详细还有代码实现 https://leileiluoluo.com/posts/kdtree-algorithm-and-implementation.html
使用KD树进行最近邻查找的例子
lhanchao: 或者说判断是否需要查找父节点的另一子节点区域的标准不是通过比较查找点与当前结点的欧式距离和查找点与当前结点父节点的欧氏距离的，而是比较查找点离结点所在的超平面的距离？
使用KD树进行最近邻查找的例子
lhanchao: kd树找到的最近邻结果不一定是正确的吧？以上面那个例子看，如果查找点为（2，,5）的时候，找到的最近邻就是（4,7）

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。