《MATLAB Deep Learning》Ch3 - Training of Multi-Layer Neural Network 学习笔记

最新推荐文章于 2020-07-19 10:49:09 发布

雪清Fand

最新推荐文章于 2020-07-19 10:49:09 发布

阅读量333

点赞数

分类专栏：学习笔记机器学习文章标签：深度学习神经网络

本文链接：https://blog.csdn.net/Xqing_2016/article/details/106526385

版权

学习笔记同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

机器学习

10 篇文章 0 订阅

订阅专栏

Back-propagation algorithm

由于隐藏层的误差项没有被很好地定义（不像输出层有真实值 $d_i$ ），多层神经网络的发展停滞了许久。1986年，后向传播算法 Back-propagation algorithm 的引入解决了这个问题。

考虑一个三层网络（输入—隐藏—输出），下面是隐藏层到输出层的转换：
在这里插入图片描述
由前面的章节，我们已经知道对于隐藏层—输出层， $\delta=\varphi^{'}(v)e$ ， $\delta_i$ 对 $W_2$ 的每一行求导，就得到输出层神经元 i 对每一个隐藏层神经元的梯度。

但是现在我们的问题是要求出输入层—隐藏层对应的 $\delta$ ，由于要更新的是 $W_{1},W_1x=v^{(1)},y^{(1)}=\varphi(v^{(1)})$ ，我们需要将 $\delta_i$ 对隐藏层神经元 $y^{(1)}$ 求导。

考虑对每一个隐藏层神经元 $y^{(1)}_{j}$ ，它通过 $w^{(2)}_{ij}$ （竖着看 W 权重矩阵）作用于输出层神经元 $y_i$ ，故对第一个隐藏层神经元，有：
在这里插入图片描述
转换成矩阵形式，即：

由此，我们可以统一隐藏层和前面单一网络结构的梯度计算形式，它们的唯一区别就是 $\delta$ 的计算不同。

Momentum

momentum 就是增加到 delta 法则上的一个附加项，它考虑到了之前的梯度的影响。
在这里插入图片描述

Cost Function and Learning Rule

在这里插入图片描述
上面是两个经典的损失函数，一个是平方误差损失函数，一个是交叉熵损失函数。“the cross entropy-driven learning rule yields a faster learning process.”

考虑如下图的交叉熵损失，当 d=1 时，y 越接近 1，损失越小；y 越接近 0，损失越大。d=0 时同理。
在这里插入图片描述

梯度计算参考：

雪清Fand

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《MATLAB Deep Learning》Ch3 - Training of Multi-Layer Neural Network 学习笔记

目录Back-propagation algorithmMomentumCost Function and Learning RuleBack-propagation algorithm由于隐藏层的误差项没有被很好地定义（不像输出层有真实值 did_idi），多层神经网络的发展停滞了许久。1986年，后向传播算法 Back-propagation algorithm 的引入解决了这个问题。考虑一个三层网络（输入—隐藏—输出），下面是隐藏层到输出层的转换：由前面的章节，我们已经知道对于隐藏层—输出
复制链接

扫一扫

专栏目录