动手学习深度学习——从零开始推导和复现反向传播

lavendelion

于 2020-02-15 18:56:16 发布

阅读量637

点赞数 2

分类专栏：深度学习文章标签：算法神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41424926/article/details/104332260

版权

反向传播——BP算法

1.符号说明
2.前向传播
3.反向传播
4. 代码实现

文中如有错误，或您有不同的看法，请评论中指出讨论，谢谢。

1.符号说明

假设网络一共有0 ~ N层，其中0为输入层，N为输出层，1 ~ N-1为隐藏层。每层网络都有 $n_L$ 个神经元，L代表第L层网络。

除了输入层以外，网络的每个神经元都有两个变量 $a^{(L)}_{i},b^{(L)}_{i}$ ，上下标分别表示第L层的第i个神经元， $b^{(L)}_{i}$ 是 $a^{(L)}_{i}$ 用激活函数 $f (x)$ 激活后的数值，即 $b^{(L)}_{i}=f(a^{(L)}_{i})$ 。

相邻的两层网络用权重 $w^{(L)}_{ij}$ 连接，表示连接第L-1层第i个神经元和第L层第j个神经元的权重。

网络的输出为 $b_1^{(N)},...,b_{n_N}^{(N)}$ ，这些输出会作为输入到一个设置好的损失函数 $E (x)$ 中，然后得到网络输出与标准值的损失值。

为了方便之后写代码，所以要用矩阵/向量的方式来表示每层网络的变量。符号说明如下：

$A^{(L)}=[a^{(L)}_1,a^{(L)}_2,...,a^{(L)}_{n_L}]_{1\times n_L}$ ；
$B^{(L)}=[b^{(L)}_1,b^{(L)}_2,...,b^{(L)}_{n_L}]_{1\times n_L}$ ;
$W^{(L)}=\bigg[ \begin{matrix}w^{(L)}_{11} ... w^{(L)}_{1n_L}\\ .........\\ w^{(L)}_{n_{L-1}1} ... w^{(L)}_{n_{L-1}n_L}\end{matrix} \bigg]_{n_{L-1}\times n_{L}}$ ；

在这里插入图片描述

2.前向传播

前向传播的主要作用就是根据网络的输入量来计算各层网络所有神经元的节点值 $A^{(L)},B^{(L)}$ ，最终根据网络的输出 $B^{(N)}$ 和输入量对应的样本标签值 $Y$ 计算损失值 $E(Y-B^{(N)})$ 。

由于前向传播比较简单，所以就不仔细分析了，就直接用矩阵变量来表示过程。

1). 初始化所有的权重 $W^{(L)},L=1,2,...,N$ ；

2). 网络的输入为 $A^{(0)}$ ，激活函数设为 $f (x)$ ，如果输入是矩阵，则表示对矩阵的每个元素执行 $f (x)$ 的映射；

3). 然后就按顺序开始计算：

$A^{(0)}\times W^{(1)}\Rightarrow A^{(1)}=A^{(0)}\times W^{(1)}\Rightarrow B^{(1)}=f(A^{(1)})$ ，

$B^{(1)}\times W^{(2)}\Rightarrow A^{(2)}=B^{(1)}\times W^{(2)}\Rightarrow B^{(2)}=f(A^{(2)})$ ，

…，

$B^{(N-1)}\times W^{(N)}\Rightarrow A^{(N)}=B^{(N-1)}\times W^{(N)}\Rightarrow B^{(N)}=f(A^{(N)})$ ，

4).最后根据损失函数计算损失值， $E(Y-B^{(N)})$ ，其中 $Y$ 是网络输入对应的标签(正确值)。

3.反向传播

反向传播顾名思义当然要从网络的反向开始，也就是损失函数。反向传播的主要目的是根据网络得到的损失值，计算损失值相对于网络每个权重的导数(梯度)，然后每个权重都利用梯度下降法进行权重值的更新。从而开始下一轮的前向传播和反向传播，使损失值越来越小，而网络的预测值逐渐贴近真实值。

那么重点就落在如何计算每个权重的梯度呢？(主要是基于“链式求导法”)

1).先从第N-1层到第N层的权重 $W^{(N)}=\{w^{(N)}_{i_{N-1}i_N}\}$ 开始分析：

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。