5、深层神经网络块、超参数

最新推荐文章于 2023-11-11 10:17:12 发布

L丫丫

最新推荐文章于 2023-11-11 10:17:12 发布

阅读量214

点赞数

文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mynameislfc/article/details/105758727

版权

此次主要学习了在搭建一个深层神经网络模块时，需要注意到哪些内容，本文将通过下图进行说明：
在这里插入图片描述
上图描述的是一个深层神经网络模型正向和反向传播的过程。每一个方框代表着一个隐藏层。
从图中得出，有几处要点需要注意：
（1）正向传播过程中，需要将每一层的 $z^{[l]}、w^{[l]}、b^{[l]}$ 进行缓存，方便反向传播时使用（尤其是在编写代码时须注意）。
（2）正向传播是由 $a^{[0]}$ 得到 $a^{[l]}$ 的过程，反向传播是由 $da^{[l]}$ 得到 $da^{[1]}$ 的过程。
（3）反向传播中，每一个层会输出 $dw^{[l]}、db^{[l]}$ ，用于梯度下降，即更新参数。
具体的公式表达形式如下图所示：
在这里插入图片描述

什么是超参数？

超参数是指能影响 $w 、 b$ 的参数，如：学习率： $\alpha$ 、隐藏层数：L、隐藏单元数： $n^{[l]}$ 等等超参数决定了最终得到的参数 $w 、 b$ 。因此，可以这样说，超参数是一种用于控制参数的参数。
在实际的神经网络学习中，超参数的选择有许多的可能性，所以需要尝试许多不同的值。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
5、深层神经网络块、超参数

此次主要学习了在搭建一个深层神经网络模块时，需要注意到哪些内容，本文将通过下图进行说明：上图描述的是一个深层神经网络模型正向和反向传播的过程。每一个方框代表着一个隐藏层。从图中得出，有几处要点需要注意：（1）正向传播过程中，需要将每一层的z[l]、w[l]、b[l]z^{[l]}、w^{[l]}、b^{[l]}z[l]、w[l]、b[l]进行缓存，方便反向传播时使用（尤其是在编写代码时须注...
复制链接

扫一扫

L丫丫 CSDN认证博客专家 CSDN认证企业博客

码龄7年

8: 原创

38万+: 周排名

26万+: 总排名

3777: 访问

: 等级

92: 积分

0: 粉丝

5: 获赞

1: 评论

14: 收藏

私信

关注

热门文章

最新评论

torch_sparse安装
CSDN-Ada助手: 恭喜你写了第9篇博客！标题为“torch_sparse安装”，非常感谢你分享关于这个主题的知识。在你的博客中，我发现了一些有关torch_sparse安装的有用信息。你的文章对于那些想要使用torch_sparse的人来说，肯定是非常有帮助的。接下来，我希望你可以继续深入探索torch_sparse的更多功能和用法，并与我们分享你的发现。谢谢你的付出，期待你未来更多的创作！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。