吴恩达深度学习 —— 4.5 搭建深层神经网络块

最新推荐文章于 2022-07-30 10:34:04 发布

然后就去远行吧

最新推荐文章于 2022-07-30 10:34:04 发布

阅读量222

点赞数

分类专栏：吴恩达深度学习

本文链接：https://blog.csdn.net/qq_37388085/article/details/103305188

版权

吴恩达深度学习专栏收录该内容

61 篇文章 30 订阅

订阅专栏

如下图，这是一个层数较少的神经网络，我们选择其中一层，从第二层隐藏层的计算着手，在第l层有参数 $W^{l[]}$ 和 $b^{[l]}$ ，正向传播里有输入的激活函数，输入的前一层是 $a^{[l-1]}$ ，输出是 $a^{[l]}$ 。 $z^{[l]}=W^{[l]}a^{[l-1]}+b$ ， $a^{[l]}=g^{[l]}(z^{[l]})$ ，这就是如何从输入 $a^{[l-1]}$ 到输出的。
在这里插入图片描述
之后就可以把 $z^{[l]}$ 的值缓存起来，因为缓存的 $z^{[l]}$ 对以后的正向和反向传播的步骤非常有用。

在反向传播步骤，同样也是第 $l$ 层的计算，你会需要实现一个函数，输入为 $da^{[l]}$ ，输出为 $da^{[l-1]}$ 。一个小细节需要注意，输入在这里其实是 $da^{[l]}$ 和缓存的 $z^{[l]}$ 值。输出除了 $da^{[l-1]}$ 外，还有 $dw^{[l]}$ 和 $db^{[l]}$ 。

总结起来就是，在第 $l$ 层会有正向函数，输入 $a^{[l-1]}$ 并且输出 $a^{[l]}$ 。为了计算结果，还需要参数 $W^{[l]}$ 和 $b^{[l]}$ ，以及输出到缓存的 $z^{[l]}$ 。

然后用作反向传播的反向函数是另外一个函数，输入 $da^{[l]}$ 输出 $da^{[l-1]}$ ，这会得到对激活函数的导数，计算过程需要 $W^{[l]}$ 和 $b^{[l]}$ 和 $dz^{[l]}$ ，可以计算输出 $dW^{[l]}$ 和 $db^{[l]}$ 。

然后就去远行吧

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吴恩达深度学习 —— 4.5 搭建深层神经网络块

如下图，这是一个层数较少的神经网络，我们选择其中一层，从第二层隐藏层的计算着手，在第l层有参数Wl[]W^{l[]}Wl[]和b[l]b^{[l]}b[l]，正向传播里有输入的激活函数，输入的前一层是a[l−1]a^{[l-1]}a[l−1]，输出是a[l]a^{[l]}a[l]。z[l]=W[l]a[l−1]+bz^{[l]}=W^{[l]}a^{[l-1]}+bz[l]=W[l]a[l−1]+...
复制链接

扫一扫

专栏目录