MLP多层感知机

一、感知机

感知机其实是一个很简单的模型,给定输入x,权重w,偏移b,x和w都是向量,b是标量。输出就是w和x做内积再加上b,然后做一个\sigma函数:

从图形上来看就是输入多元素,输出单元素,实际上就是二分类的一个问题。这里输出的是一个离散的类;和softmax不同这里只二分类。

训练感知机的过程:

如果分类错误就对w和b进行一次更新,一直做直到所有类分类正确;

如果分类正确,那就是0,不做更新,反之更新。

收敛定理:什么时候停?

问题:感知机不能拟合XOR函数,只能产生线性分割面。(过于简单)

二、多层感知机

学习XOR,我们想要把完全分类的话,可以:

学习一根蓝色的线和一根黄色的线。简单来说就是下面的图:

先考虑一下单分类的问题:

三、总结

多层感知机的核心定义围绕 **“层数” 和 “非线性”** 展开,是对 “感知机” 的扩展:

  • 感知机(Perceptron):1957 年提出的单层线性模型(输入层 + 输出层,无隐藏层),仅能解决 “线性可分问题”(如用直线分割二维数据),无法处理非线性问题(如异或 XOR);

  • 多层感知机(MLP):为解决感知机的局限性,在 “输入层” 和 “输出层” 之间加入至少 1 个隐藏层,并在隐藏层引入非线性激活函数(如 ReLU、sigmoid、tanh)的模型。

  • 关键特征:同时约束 “层数”(≥1 个隐藏层)和 “非线性”(必须有激活函数),且默认采用全连接结构(因为若用局部连接或其他结构,会被归为 CNN、RNN 等其他模型)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

何仙鸟

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值