神经网络各参数矩阵大小的计算总结

这篇博客探讨了深度学习中矩阵运算的原理,包括权重矩阵W[l]、偏置b[l]的形状计算,以及前向传播过程中Z[l]和A[l]的计算。内容涉及输入X和输出Y的维度,以及激活函数的应用,揭示了神经网络层数、节点数量与样本数量之间的关系。
摘要由CSDN通过智能技术生成

假设:
矩阵层数为 l l l,所在层的node个数为 n ( l ) n^{(l)} n(l),X: input, Y: output,样本个数为 m m m,有以下的矩阵大小的计算方法:
W [ l ] . s h a p e = ( n [ l ] , n [ l − 1 ] ) W^{[l]}.shape = (n^{[l]}, n^{[l-1]}) W[l].shape=(n[l],n[l1])
X . s h a p e = ( n [ 0 ] , 1 ) X.shape = (n^{[0]}, 1) X.shape=(n[0],1)
Y . s h a p e = ( n [ l ] , 1 ) Y.shape = (n^{[l]}, 1) Y.shape=(n[l],1), l取层数最大值
Z [ l ] = W [ l ] A [ l − 1 ] + b [ l ] Z^{[l]}= W^{[l]}A^{[l-1]} + b^{[l]} Z[l]=W[l]A[l1]+b[l]
A [ l ] = a c t i v a t i o n ( Z [ l ] ) A^{[l]} = activation(Z^{[l]}) A[l]=activation(Z[l])
Z [ l ] . s h a p e = A [ l ] . s h a p e = ( n [ l ] , m ) Z^{[l]}.shape = A^{[l]}.shape = (n^{[l]}, m) Z[l].shape=A[l].shape=(n[l],m)
b [ l ] . s h a p e = ( n [ l ] , 1 ) b^{[l]}.shape = (n^{[l]}, 1) b[l].shape=(n[l],1)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值