deeplearning.ai 总结 - 如何计算神经网络各部分的shape

最新推荐文章于 2024-03-18 10:11:06 发布

西笑生

最新推荐文章于 2024-03-18 10:11:06 发布

阅读量1.1k

点赞数

分类专栏：深度学习文章标签： deeplearning.ai

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/flyfish1986/article/details/79739260

版权

深度学习专栏收录该内容

149 篇文章 29 订阅

订阅专栏

deeplearning.ai 总结 - 如何计算神经网络各部分的shape

flyfish

标记方法采用deeplearning.ai的标记方法

这里写图片描述
输入层（Input layer）
隐藏层（Hidden layer）
输出层（Output layer）。

上图中是两层神经网络，输出层不算。
输入矩阵X记为

a [0]

$a^{[0]}$ ，
隐藏层输出记为

a [1]

$a^{[1]}$ 。

a [1] 1]

$a_1^{[1]}]$ 表示隐藏层第1个神经元，

a [1] 2]

$a_2^{[1]}]$ 表示隐藏层第2个神经元。

隐藏层有4个神经元写成矩阵的形式是

a [1] = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ a [1] 1 a [1] 2 a [1] 3 a [1] 4 ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥

$\boldsymbol{a^{[1]}}= \left[ \begin{matrix} a_1^{[1]} \\ a_2^{[1]} \\ a_3^{[1]} \\ a_4^{[1]} \end{matrix} \right]$

输出层记为

a [2]

$a^{[2]}$

计算过程

z = w T x + b

$z=w^Tx+b$

a = σ (z)

$a=\sigma(z)$

从输入层到隐藏层的计算

z [1] 1 = w [1] T 1 x + b [1] 1, a [1] 1 = σ (z [1] 1)

$z_1^{[1]}=w_1^{[1]T}x+b_1^{[1]},\ a_1^{[1]}=\sigma(z_1^{[1]})$

z [1] 2 = w [1] T 2 x + b [1] 2, a [1] 2 = σ (z [1] 2)

$z_2^{[1]}=w_2^{[1]T}x+b_2^{[1]},\ a_2^{[1]}=\sigma(z_2^{[1]})$

z [1] 3 = w [1] T 3 x + b [1] 3, a [1] 3 = σ (z [1] 3)

$z_3^{[1]}=w_3^{[1]T}x+b_3^{[1]},\ a_3^{[1]}=\sigma(z_3^{[1]})$

z [1] 4 = w [1] T 4 x + b [1] 4, a [1] 4 = σ (z [1] 4)

$z_4^{[1]}=w_4^{[1]T}x+b_4^{[1]},\ a_4^{[1]}=\sigma(z_4^{[1]})$

隐藏层到输出层的计算

z [2] 1 = w [2] T 1 a [1] + b [2] 1, a [2] 1 = σ (z [2] 1)

$z_1^{[2]}=w_1^{[2]T}a^{[1]}+b_1^{[2]},\ a_1^{[2]}=\sigma(z_1^{[2]})$

转换成矩阵计算

Z [1] = W [1] X + b [1]

$Z^{[1]}=W^{[1]}X+b^{[1]}$

A [1] = σ (Z [1])

$A^{[1]}=\sigma(Z^{[1]})$

Z [2] = W [2] A [1] + b [2]

$Z^{[2]}=W^{[2]}A^{[1]}+b^{[2]}$

A [2] = σ (Z [2])

$A^{[2]}=\sigma(Z^{[2]})$

W [1]

$W^{[1]}$ 的维度是（4,3），4是隐藏层神经元个数，3是输入层特征数

b [1]

$b^{[1]}$ 的维度是（4,1），

W [2]

$W^{[2]}$ 的维度是（1,4），
1对应着输出层神经元个数，4对应着隐藏层神经元个数。

b [2]

$b^{[2]}$ 的维度是（1,1）。

多个样本使用矩阵

f o r i = 1 到 m

$for i=1 到 m$

z [1] (i) = W [1] x (i) + b [1]

$\ \ \ \ z^{[1](i)}=W^{[1]}x^{(i)}+b^{[1]}$

a [1] (i) = σ (z [1] (i))

$\ \ \ \ a^{[1](i)}=\sigma(z^{[1](i)})$

z [2] (i) = W [2] a [1] (i) + b [2]

$\ \ \ \ z^{[2](i)}=W^{[2]}a^{[1](i)}+b^{[2]}$

a [2] (i) = σ (z [2] (i))

$\ \ \ \ a^{[2](i)}=\sigma(z^{[2](i)})$

矩阵方式是

Z [1] = W [1] X + b [1]

$Z^{[1]}=W^{[1]}X+b^{[1]}$

A [1] = σ (Z [1])

$A^{[1]}=\sigma(Z^{[1]})$

Z [2] = W [2] A [1] + b [2]

$Z^{[2]}=W^{[2]}A^{[1]}+b^{[2]}$

A [2] = σ (Z [2])

$A^{[2]}=\sigma(Z^{[2]})$

行是神经元个数，列是样本数目m

Z [1]

$Z^{[1]}$ 和

A [1]

$A^{[1]}$ 的维度是（4,m）

Z [2]

$Z^{[2]}$ 和

A [2]

$A^{[2]}$ 的维度均为（1,m）。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

西笑生 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。