感知机模型、多层感知机、激励函数以及BP算法的一些理解

最新推荐文章于 2024-05-06 18:55:08 发布

zzzfeiyu

最新推荐文章于 2024-05-06 18:55:08 发布

阅读量560

点赞数

分类专栏：机器学习文章标签：机器学习神经网络人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzzfeiyu/article/details/106803830

版权

本文介绍了感知机模型，它是人工神经网络的基础，通过多层感知机来增强表达能力。讨论了激励函数的重要性，它用于保持非线性特性并优化训练过程。同时，解释了BP算法在多层感知机中如何更新权重，以实现更好的分类效果。

摘要由CSDN通过智能技术生成

感知机

感知机模型起源于人工神经网络中最简单的结构，大致结构如下

在这里插入图片描述

多层感知机

感知机的输入层是在模拟输入的"形状"，可以通过约束条件：联立的一元方程组来描述输入在空间中定位，一层输入可以近似成用无限条直线的方程去描述任意形状，在此之外再嵌套一层可以描述任意个数的形状之间的逻辑关系，如图所示就是一个逻辑或，算法判断输入1或者输入2有效的时候最终的输出y =∑ w*x +b = 1

在这里插入图片描述

表现在几何上是这样的：

在这里插入图片描述

事实上在每一层如果仅仅权重w与偏置b计算然后求和，输入在每一层仅仅是变换系数和b的值而已，无法描述一个非线性的变化，个人理解会在训练丢失这种非线性的特质，这是不希望看的情况，所以在每层计算 a = w *x + b之后会给a一个非线性的函数f(x) 例如阶跃函数 sgn(x)，将f(a)作为下一层的输入就使得本层在一定层度上保留了输入的非线性特征

激励函数

由于现实的大多数模型都是非线性的，所以保留非线性特征对训练的结果很重要，且f(x)的求导需要用在反向传播中，鉴于以下几点：

输入的特征是未知的，即我们并不知道是否是线性，更不知道如何分布，但是我们希望在处理时尽可能保留这种特征
不希望在中间层计算的结果溢出，也就是过大或者过小，更希望将这个f(x)输出的值也就是下一层的输入限定在一个范围内
f(x)的求导在反向传播中会持续影响后续的梯度，所以f(x)的梯度越大效果相对越好

综合来看，我们希望得到一个值域

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。