【DL】Week4-多层神经网络

最新推荐文章于 2022-05-14 22:07:06 发布

Tialyg

最新推荐文章于 2022-05-14 22:07:06 发布

阅读量709

点赞数 2

分类专栏：实战笔记文章标签：神经网络深度学习机器学习

本文链接：https://blog.csdn.net/qq_42292095/article/details/122102231

版权

笔记同时被 2 个专栏收录

29 篇文章 1 订阅

订阅专栏

实战

19 篇文章 1 订阅

订阅专栏

文章目录

- 全连接神经网络

全连接神经网络

步骤：
在这里插入图片描述

学习过程中特此记录一下遇到的问题：
问题一：
为什么初始化单层神经网络时，为

  W1 = np.random.randn(n_h, n_x) * 0.01`

而构建多层神经网络时，为

parameters["W" + str(l)] = np.random.randn(layers_dims[l], layers_dims[l - 1]) / np.sqrt(layers_dims[l - 1])

解答：
1、在课程2『改善深层神经网络：超参数调试、正则化以及优化』中第一周的第11讲『神经网络的权重初始化』中有详细解释：
2、只有2层及以下神经网络的权重初始化才是*0.01，而多层神经网络都要 /np.sqrt(layers_dims[l-1])，即要除以其前一层神经元数量的平方根。
2、原因：因为
在这里插入图片描述