学习日志(三):感知机

在读这篇文中前可以先读《神经网络:从人脑到人工》这篇文章了解一下相关基础知识!
  麦克洛克和皮茨提出的“M-P神经元模型”,是对生物大脑的过度简化,但却成功地给我们提供了基本原理的证明。尽管在AI的发展过程中不断的有其它的模型被提出,但M-P神经元模型是目前用的最多的和最广的,可谓是现在神经网络的基石,例如 logistic 回归、支持向量机甚至深度神经网络都是以它为起点。
  然而M-P 模型的权重和偏置是固定的,不具备学习的能力。这个问题在皮茨等人发表论文15年之后,在 1958 年, 由康内尔大学心理学教授弗兰克·罗森布拉特( Frank Rosenblatt) 提出了第一个具有学习能力的神经网络,称之为感知机,这是一个两层的人工神经网络,成为后来许多神经网络的基础,但它的理论基础依然还是皮茨等人提出来的M-P神经元模型。

感知机(Perceptron)

  感知机的思想很简单,比如我们在一个平台上有很多的男孩女孩,感知机的模型就是尝试找到一条直线,能够把所有的男孩和女孩隔离开。放到三维空间或者更高维的空间,感知机的模型就是尝试找到一个超平面,能够把所有的二元类别隔离开。当然你会问,如果我们找不到这么一条直线的话怎么办?找不到的话那就意味着类别线性不可分,也就意味着感知机模型不适合你的数据的分类。使用感知机一个最大的前提也可以说是限制或者缺点,就是数据是线性可分的。这严重限制了感知机的使用场景。它的分类竞争对手在面对不可分的情况时,比如支持向量机可以通过核技巧来让数据在高维可分,神经网络可以通过激活函数和增加隐藏层来让数据可分。接下来我们从模型,策略,算法等几个方面来讲解感知机。
超平面: 是指n维线性空间中维度为n-1的子空间,在三维空间中超平面就是一个二维的平面,在二维空间中超平面就是一条直线

1.感知机要处理的问题?

  感知机是有监督的二分类线性模型(Binary),其输入是实例的特征向量,输出的是事例的类别,分别是+1和-1,属于判别模型。
  下面通过俩幅图来说清楚感知机要处理的问题是什么?下图中有蓝色和黑色俩种颜色的数据,一条红线将俩种颜色的数据一分为二,而如何求出这条红线就是感知机要解决的问题。
在这里插入图片描述
  就比如下面这张图也是对感知机研究问题的描述,与门、或门和与非门这三种对应的数据就是线性可分的就可以用感知机来处理,如果是异或门这样的数据,就需要多层感知机或者其他方法来处理,因为一条直线怎么都不可能把俩种数据分隔开来。
在这里插入图片描述

2.感知机模型

在这里插入图片描述
  上图就是根据大脑中信息的传递方式给出的感知机的模型,下面从数学角度给出更加公式化的定义:
在这里插入图片描述
模型的几何解释:
在这里插入图片描述

3.感知机模型的学习策略

在这里插入图片描述
在这里插入图片描述

4.感知机模型的学习算法

在这里插入图片描述
算法流程图:
在这里插入图片描述
关于感知机的简单记录就这样了,下方链接的视频讲解的很详细,有需要的可以看一下,我学不会我只是搬运工。
参考文献:
1.感知机原理小结
2.深度学习起源—感知机
3.感知机

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值