卷积神经网络识别手写数字体笔记（二），主要转自深度神经网络（DNN）反向传播算法(BP)

最新推荐文章于 2022-04-15 23:49:23 发布

大发发发233

最新推荐文章于 2022-04-15 23:49:23 发布

阅读量264

点赞数

分类专栏： notes for study

notes for study 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

反向传播Back Propagation
DNN中BP解决问题：
已知：m个训练样本： ${(x_1,y_1), (x_2,y_2), ..., (x_m,y_m)\}$ , $attrs(特征)\times n\_in$ , $attrs(特征)\times n\_out$ (特征维度)。
目标： $x_{test},?)$ 预测 $y_{test}$
过程：训练样本输入计算出的输出尽可能的等于或很接近样本输出。用一个合适的损失函数来度量训练样本的输出损失，损失函数进行优化求最小化的极值，使用梯度下降法迭代。

DNN反向传播算法过程
　　　　由于梯度下降法有批量（Batch），小批量(mini-Batch)，随机三个变种，这里我们以最基本的批量梯度下降法为例来描述反向传播算法。实际上在业界使用最多的是mini-Batch的梯度下降法。不过区别仅仅在于迭代时训练样本的选择而已。

输入: 总层数L，以及各隐藏层与输出层的神经元个数，激活函数，损失函数，迭代步长 $α$ ,最大迭代次数MAX与停止迭代阈值 $ϵ$ ，输入的m个训练样本 ${(x_1,y_1), (x_2,y_2), ..., (x_m,y_m)\}$
　　　　输出：各隐藏层与输出层的线性关系系数矩阵 $W$ 和偏倚向量 $b$
　　　　1) 初始化各隐藏层与输出层的线性关系系数矩阵 $W$ 和偏倚向量 $b$ 的值为一个随机值。

2）for iter to 1 to MAX：
　　　　2-1) for i =1 to m：
　　　　　　a) 将DNN输入 $a^1$ 设置为 $x_i$
　　　　　　b) for $l$ =2 to L，进行前向传播算法计算 $a^{i,l} = \sigma(z^{i,l}) = \sigma(W^la^{i,l-1} + b^l)$
　　　　　　c) 通过损失函数计算输出层的 $δ_i^L$
　　　　　　d) for $l$ = L-1 to 2, 进行反向传播算法计算 $\delta^{i,l} = (W^{l+1})^T\delta^{i,l+1}\odot \sigma^{'}(z^{i,l})$
　　　　2-2) for $l$ = 2 to L，更新第 $l$ 层的 $W_l$ , $b_l$ : $W^l = W^l -\alpha \sum\limits_{i=1}^m \delta^{i,l}(a^{i, l-1})^T$ , $b^l = b^l -\alpha \sum\limits_{i=1}^m \delta^{i,l}$
　　　　2-3) 如果所有 $W$ ， $b$ 的变化值都小于停止迭代阈值 $ϵ$ ，则跳出迭代循环到步骤3。
　　　　3）输出各隐藏层与输出层的线性关系系数矩阵 $W$ 和偏倚向量 $b$ 。

大发发发233

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
卷积神经网络识别手写数字体笔记（二），主要转自深度神经网络（DNN）反向传播算法(BP)

卷积神经网络识别手写数字体笔记（二），主要转自深度神经网络（DNN）反向传播算法(BP)反向传播Back PropagationDNN中BP解决问题：新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新功能，帮助你用它写博客：全新的界面设计，将会带来全新的写作体验；在创作中心设置你喜爱的代码高亮样式，Mar...
复制链接

扫一扫