深度学习笔记（十三）搭建深层神经网络块及前向反向传播过程

最新推荐文章于 2024-01-10 13:35:42 发布

Mr.zwX

最新推荐文章于 2024-01-10 13:35:42 发布

阅读量333

点赞数 1

分类专栏：【深度学习/神经网络】Deep Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16763983/article/details/112238877

版权

【深度学习/神经网络】Deep Learning 专栏收录该内容

84 篇文章 46 订阅

订阅专栏

个人认为这一课非常重要！！！ 我们已经掌握了前向传播和反向传播的基础知识，那么如何搭建一个深层神经网络的框架结构，是至关重要的，只有网络块结构清晰了，我们才真正理解到整个神经网络框架是怎么样实现的。

一、搭建深层神经网络块

以神经网络的第 $l$ 层为例，分析一下前向传播、反向传播的输入及输出元素。
在这里插入图片描述

参数： $w^{[l]},b^{[l]}$
前向：输入 $a^{[l-1]}$ ，输出 $a^{[l]}$
$z^{[l]}=w^{[l]}a^{[l-1]}+b^{[l]},cache（缓存）z^{[l]}$
$a^{[l]}=g^{[l]}(z^{[l]})$
反向：输入 $da^{[l]},cache(z^{[l]})$ ，输出 $da^{[l-1]},dw^{[l]},db^{[l]}$

为了更清晰地表示出搭建输出网络块的过程，我画了如下一幅正反向传播流程图，在这幅图中标出了各个参数变量以及传播的方向。

方框表示神经网络的每一层中的参数
蓝色箭头表示前向传播
红色箭头表示反向传播
绿色箭头表示前向传播的缓存变量值，方便反向传播计算使用
紫色箭头表示计算出的供参数更新的导数值

在如上过程中，实现了一次梯度下降的循环。
值得注意的一点是，将计算出来的 $z, w, b$ 值进行缓存，在编程时会发现缓存非常方便，因为在计算反向传播中的导数时，缓存的数据可以迅速提供，从而快速求得 $d w, d b$

在这样一个复习梳理的过程中，神经网络的架构越来越清晰，对前向传播、反向传播的原理也会理解得越来越到位。

二、前向传播与反向传播

Forwords
在这里插入图片描述
向量化计算式：
$Z^{[l]}=w^{[l]}a^{[l-1]}+b^{[l]}$

$A^{[l]}=g^{[l]}(Z^{[l]})$

Backwards
在这里插入图片描述
用键盘输入这组计算式比较费时，但是我还是把这个过程写一写，列得更清晰一点儿。

$dZ^{[l]}=A^{[l]}*g'^{[l]}(z^{[l]})$

$dw^{[l]}=\frac{1}{m} dZ^{[l]} {A^{[l-1]}}^T$

$db^{[l]}=\frac{1}{m} np.sum(dz^{[l]}, axis=1, keepdims=True)$

$dA^{[l-1]}=w^{[l]T}dZ^{[l]}$

在这里插入图片描述

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习笔记（十三）搭建深层神经网络块及前向反向传播过程

个人认为这一课非常重要，我们已经掌握了前向传播和反向传播的基础知识，那么如何搭建一个深层神经网络的框架结构，是至关重要的，只有网络块结构清晰了，我们才真正理解到整个神经网络框架是怎么样实现的。以神经网络的第lll层为例，分析一下前向传播、反向传播的输入及输出元素。参数：w[l],b[l]w^{[l]},b^{[l]}w[l],b[l]前向：输入a[l−1]a^{[l-1]}a[l−1]，输出a[l]a^{[l]}a[l]z[l]=w[l]a[l−1]+b[l],cache（缓存）z[l]z^{[
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Mr.zwX 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。