UnusualDeepLearning-task3

最新推荐文章于 2023-02-19 00:10:09 发布

yxyibb

最新推荐文章于 2023-02-19 00:10:09 发布

阅读量643

点赞数

分类专栏：算法梳理文章标签：人工智能机器学习深度学习

本文链接：https://blog.csdn.net/u012835414/article/details/121351208

版权

算法梳理专栏收录该内容

23 篇文章 0 订阅

订阅专栏

本文详细解读了前馈神经网络的基础，包括M-P神经元模型、单层和多层感知器的线性可分与不可分、BP算法的流程、激活函数选择及其示例。讨论了优化中的难点，如非凸优化、梯度消失，并强调了大数据和计算资源的需求。

摘要由CSDN通过智能技术生成

task3前馈神经网络

(Datawhale31期组队学习)

文章目录

task3前馈神经网络

基础点

神经元模型
- 神经元（M-P）
- 网络结构
感知器、多层感知器
- 单层感知器
- 多层感知器
BP算法
- 基本过程
- 激活函数
- 示例
优化

知识点

1 神经元模型

神经网络是最早的一种连接模型
在这里插入图片描述

1.1 神经元（M-P）

M-P模型，神经元接受其他n个神经元输入信号（0or1），经权重加权求和，结果与阈值（threshold） θ 比较，经过激活函数处理得到神经元输出。（人为确定参数）
$y=f(\sum_{i=1}^nw_{ij}x_i-θ)$
运算：

取反，单输入单输出
逻辑或、逻辑与，双输入单输出

1.2 网络结构

神经元模型构成，由许多神经元组成的信息处理网络具有并行分布结构
在这里插入图片描述一个圆点表示一个神经元，方形点表示一组神经元。

2 感知器

2.1 单层感知器-线性可分

通过训练自动确定参数
有监督学习，设定样本与期望，调整实际输出与期望输出之差（误差修正学习）
$w_i \leftarrow w_i+\alpha(\gamma-y)x$ $\theta \leftarrow \theta - \alpha(\gamma-y)$
$\alpha$ 学习率， $\gamma$ 期望输出， $y$ 实际输出
调整权重
- 实际输出y与期望输出r相等， $w$ 、 $\theta$ 不变
- 实际输出y与期望输出r不相等，按公式调整 $w$ 、 $\theta$
训练

2.2 多层感知器-线性不可分

在这里插入图片描述
多层感知器指的是由多层结构的感知器递阶组成的输入值向前传播的网络，也被称为前馈网络或正向传播网络。

在这里插入图片描述

与M-P模型相同，中间感知器通过权重与输入层各单元相连接，通过阈值函数计算中间层各单元的输出值
中间层与输出层间同样通过权重连接

3 BP算法

误差反向传播算法（ErrorBackPropagation）BP算法：训练调整参数。

3.1 过程

前向传播计算：由输入层经过隐含层向输出层的计算网络输出
误差反向逐层传递:网络的期望输出与实际输出之差的误差信号由输出层经过隐含层逐层向输入层传递
由“前向传播计算”与“误差反向逐层传递”的反复进行的网络训练，调整各层的连接权重以减小误差，到达阈值后训练好模型
调整方法：典型的梯度下降法
$\Delta w = - \alpha \frac{\partial E}{\partial w}$

3.2 激活函数

M-P 模型中使用阶跃函数作为激活函数，只能输出 0或 1，不连续所以不可导
Sigmoid函数，可导，用于二分类
$\frac{df(u)}{du}=f(u)(1-f(u))$
ReLU（修正线性单元）
tanh

3.3 BP示例

包含一个中间层和一个输出单元 $y$ 的多层感知器为例： $w_{1ij}$ 表示输入层与中间层之间的连接权重， $w_{2j1}$ 表示中间层与输出层之间的连接权重， $i$ 表示输入层单元， $j$ 表示中间层单元

在这里插入图片描述

调整中间层与输出层之间的连接权重， $y = f (u)$ ， $f$ 是激活函数， $u_{21}=\sum_{j=1}^mw_{2j1}z_j$ ，把误差函数E对连接权重 $w_{2j1}$ 的求导展开复合函数求导：
$\frac{\partial E}{\partial w_{2j1}}=\frac{\partial E}{\partial y} \frac{\partial y}{\partial u_{21}} \frac{\partial u_{21}}{\partial w_{2j1}} =-(r-y)y(1-y)z_j$
$z_j$ 中间层的值
中间层到输出层的连接权重调整值
$\Delta w_{2j1}= \alpha(r-y)y(1-y)z_j$
调整输入层与中间层间的连接权重
$\frac{\partial E}{\partial w_{1ij}}=\frac{\partial E}{\partial y} \frac{\partial y}{\partial u_{21}} \frac{\partial u_{21}}{\partial w_{1ij}} =-(r-y)y(1-y) \frac{\partial u_{21}}{\partial w_{1ij}}$

中间层到输出层
在这里插入图片描述

输入层到中间层
在这里插入图片描述

4 优化问题

4.1 难点

参数过多，影响训练
非凸优化问题，即存在局部最优而非全局最优解，影响迭代
梯度消失问题，下层参数比较难调
参数解释起来比较困难

4.2 需求

计算资源更大
数据要多
算法效率要好，及收敛好

4.3 非凸优化问题

在这里插入图片描述

4.4 梯度消失问题

在这里插入图片描述

参考

https://datawhalechina.github.io/unusual-deep-learning

yxyibb

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
UnusualDeepLearning-task3

task3前馈神经网络(Datawhale31期组队学习)文章目录task3前馈神经网络基础点知识点1 神经元模型1.1 神经元（M-P）1.2 网络结构2 感知器2.1 单层感知器-线性可分2.2 多层感知器-线性不可分3 BP算法3.1 过程3.2 激活函数3.3 BP示例4 优化问题4.1 难点4.2 需求4.3 非凸优化问题4.4 梯度消失问题参考基础点神经元模型神经元（M-P）网络结构感知器、多层感知器单层感知器多层感知器BP算法基本过程激活函数示例
复制链接

扫一扫

专栏目录