【算法周】哆啦A梦，我想要个“感知机”

哈希大数据

于 2018-06-21 10:30:23 发布

阅读量543

点赞数

分类专栏： python 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HashData2018/article/details/80756320

版权

欢迎关注哈希大数据微信公众号《哈希大数据》

感知机可以说是最古老的分类方法之一了，在1957年就已经提出。今天看来它的分类模型在大多数时候泛化能力不强，但是它的原理却值得好好研究。因为研究透了感知机模型，学习支持向量机的话会降低不少难度。同时如果研究透了感知机模型，再学习神经网络，深度学习，也是一个很好的起点。这里对感知机的原理做一个小结。

1. 感知机模型

感知机的思想很简单，比如我们在一个平台上有很多的男孩女孩，感知机的模型就是尝试找到一条直线，能够把所有的男孩和女孩隔离开。放到三维空间或者更高维的空间，感知机的模型就是尝试找到一个超平面，能够把所有的二元类别隔离开。当然你会问，如果我们找不到这么一条直线的话怎么办？找不到的话那就意味着类别线性不可分，也就意味着感知机模型不适合你的数据的分类。使用感知机一个最大的前提，就是数据是线性可分的。这严重限制了感知机的使用场景。它的分类竞争对手在面对不可分的情况时，比如支持向量机可以通过核技巧来让数据在高维可分，神经网络可以通过激活函数和增加隐藏层来让数据可分。

用数学的语言来说，如果我们有m个样本，每个样本对应于n维特征和一个二元类别输出，如下：

　(x₁⁽⁰⁾,x₂⁽⁰⁾,...x_n⁽⁰⁾,y₀), (x₁⁽¹⁾,x₂⁽¹⁾,...x_n⁽¹⁾,y₁),...

(x₁^(m),x₂^(m),...x_n^(m),y_m)

我们的目标是找到这样一个超平面：

　θ₀+θ₁x₁+...+θ_nx_n=0

让其中一种类别的样本都满足θ₀+θ₁x₁+...+θ_nx_n>0,让另一种类别的样本都满足θ₀+θ₁x₁+...+θ_nx_n<0 .

从而得到线性可分。如果数据线性可分，这样的超平面一般都不是唯一的，也就是说感知机模型可以有多个解。

为了简化这个超平面的写法，我们增加一个特征

x₀=1 ，这样超平面为

进一步用向量来表示为： θ∙x=0,其中θ为(n+1)x1的向量，x为 (n+1)x1 的向量, ∙为内积，后面我们都用向量来表示超平面。

最低0.47元/天解锁文章

哈希大数据

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【算法周】哆啦A梦，我想要个“感知机”

感知机可以说是最古老的分类方法之一了，在1957年就已经提出。今天看来它的分类模型在大多数时候泛化能力不强，但是它的原理却值得好好研究。因为研究透了感知机模型，学习支持向量机的话会降低不少难度。同时如果研究透了感知机模型，再学习神经网络，深度学习，也是一个很好的起点。这里对感知机的原理做一个小结。1. 感知机模型感知机的思想很简单，比如我们在一个平台上有很多的男孩女孩，感知机的模型就是尝试找到一条...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。