神经网络中的矩阵维度

多层神经网络

多层神经网络

单样本

  • 神经网络第一层:
    Z [ 1 ] = W [ 1 ] ∗ X + b [ 1 ] Z^{[1]}=W^{[1]}*X+b^{[1]} Z[1]=W[1]X+b[1]
    各矩阵维度:
    Z [ 1 ] : ( n [ 1 ] , 1 ) : ( 3 , 1 ) X : ( n [ 0 ] , 1 ) : ( 2 , 1 ) W [ 1 ] : ( n [ 1 ] , n [ 0 ] ) : ( 3 , 2 ) b [ 1 ] : ( n [ 1 ] , 1 ) : ( 3 , 1 ) Z^{[1]}: (n^{[1]},1):(3,1)\\ X:(n^{[0]},1):(2,1)\\ W^{[1]}:(n^{[1]},n^{[0]}):(3,2)\\ b^{[1]}:(n^{[1]},1):(3,1) Z[1]:(n[1],1):(3,1)X:(n[0],1):(2,1)W[1]:(n[1],n[0]):(3,2)b[1]:(n[1],1):(3,1)
  • 神经网络第二层:
    Z [ 2 ] = W [ 2 ] ∗ a [ 1 ] + b [ 2 ] Z^{[2]}=W^{[2]}*a^{[1]}+b^{[2]} Z[2]=W[2]a[1]+b[2]
    各矩阵维度:
    Z [ 2 ] : ( n [ 2 ] , 1 ) : ( 5 , 1 ) a [ 1 ] : ( n [ 1 ] , 1 ) : ( 3 , 1 ) W [ 2 ] : ( n [ 2 ] , n [ 1 ] ) : ( 5 , 3 ) b [ 2 ] : ( n [ 2 ] , 1 ) : ( 5 , 1 ) Z^{[2]}: (n^{[2]},1):(5,1)\\ a^{[1]}:(n^{[1]},1):(3,1)\\ W^{[2]}:(n^{[2]},n^{[1]}):(5,3)\\ b^{[2]}:(n^{[2]},1):(5,1) Z[2]:(n[2],1):(5,1)a[1]:(n[1],1):(3,1)W[2]:(n[2],n[1]):(5,3)b[2]:(n[2],1):(5,1)
  • 神经网络第三层:
    Z [ 3 ] = W [ 3 ] ∗ a [ 2 ] + b [ 3 ] Z^{[3]}=W^{[3]}*a^{[2]}+b^{[3]} Z[3]=W[3]a[2]+b[3]
    各矩阵维度:
    Z [ 3 ] : ( n [ 3 ] , 1 ) : ( 4 , 1 ) a [ 2 ] : ( n [ 2 ] , 1 ) : ( 5 , 1 ) W [ 3 ] : ( n [ 3 ] , n [ 2 ] ) : ( 4 , 5 ) b [ 3 ] : ( n [ 3 ] , 1 ) : ( 4 , 1 ) Z^{[3]}: (n^{[3]},1):(4,1)\\ a^{[2]}:(n^{[2]},1):(5,1)\\ W^{[3]}:(n^{[3]},n^{[2]}):(4,5)\\ b^{[3]}:(n^{[3]},1):(4,1) Z[3]:(n[3],1):(4,1)a[2]:(n[2],1):(5,1)W[3]:(n[3],n[2]):(4,5)b[3]:(n[3],1):(4,1)
  • 神经网络第四层:
    Z [ 4 ] = W [ 4 ] ∗ a [ 3 ] + b [ 4 ] Z^{[4]}=W^{[4]}*a^{[3]}+b^{[4]} Z[4]=W[4]a[3]+b[4]
    各矩阵维度:
    Z [ 4 ] : ( n [ 4 ] , 1 ) : ( 2 , 1 ) a [ 3 ] : ( n [ 3 ] , 1 ) : ( 4 , 1 ) W [ 4 ] : ( n [ 4 ] , n [ 3 ] ) : ( 2 , 4 ) b [ 4 ] : ( n [ 4 ] , 1 ) : ( 4 , 1 ) Z^{[4]}: (n^{[4]},1):(2,1)\\ a^{[3]}:(n^{[3]},1):(4,1)\\ W^{[4]}:(n^{[4]},n^{[3]}):(2,4)\\ b^{[4]}:(n^{[4]},1):(4,1) Z[4]:(n[4],1):(2,1)a[3]:(n[3],1):(4,1)W[4]:(n[4],n[3]):(2,4)b[4]:(n[4],1):(4,1)
  • 神经网络第五层:
    Z [ 5 ] = W [ 5 ] ∗ a [ 4 ] + b [ 5 ] Z^{[5]}=W^{[5]}*a^{[4]}+b^{[5]} Z[5]=W[5]a[4]+b[5]
    各矩阵维度:
    Z [ 5 ] : ( n [ 5 ] , 1 ) : ( 1 , 1 ) a [ 4 ] : ( n [ 4 ] , 1 ) : ( 2 , 1 ) W [ 5 ] : ( n [ 5 ] , n [ 4 ] ) : ( 1 , 2 ) b [ 5 ] : ( n [ 5 ] , 1 ) : ( 1 , 1 ) Z^{[5]}: (n^{[5]},1):(1,1)\\ a^{[4]}:(n^{[4]},1):(2,1)\\ W^{[5]}:(n^{[5]},n^{[4]}):(1,2)\\ b^{[5]}:(n^{[5]},1):(1,1) Z[5]:(n[5],1):(1,1)a[4]:(n[4],1):(2,1)W[5]:(n[5],n[4]):(1,2)b[5]:(n[5],1):(1,1)

以此类推,神经网络层数为L时:
Z [ L ] = W [ L ] ∗ a [ L − 1 ] + b [ L ] Z^{[L]}=W^{[L]}*a^{[L-1]}+b^{[L]} Z[L]=W[L]a[L1]+b[L]
各矩阵维度:
Z [ L ] : ( n [ L ] , 1 ) a [ L − 1 ] : ( n [ L − 1 ] , 1 ) W [ L ] : ( n [ L ] , n [ L − 1 ] ) b [ L ] : ( n ( L ) , 1 ) Z^{[L]}:(n^{[L]},1)\\ a^{[L-1]}:(n^{[L-1]},1)\\ W^{[L]}:(n^{[L]},n^{[L-1]})\\ b^{[L]}:(n^{(L)},1) Z[L]:(n[L],1)a[L1]:(n[L1],1)W[L]:(n[L],n[L1])b[L]:(n(L),1)

多样本

当输入训练集时多样本时,即:
X = ( ( x 11 , x 12 , x 13 . . . x 1 n x ) T , ( x 21 , x 22 , x 23 . . . x 2 n x ) T . . . ( x m 1 , x m 2 , x m 3 . . . x m n x ) T ) : ( n x , m ) X=((x_{11},x_{12},x_{13}...x_{1nx})^T,(x_{21},x_{22},x_{23}...x_{2nx}) ^T...(x_{m1},x_{m2},x_{m3}...x_{mnx})^T):(n_x,m) X=((x11,x12,x13...x1nx)T,(x21,x22,x23...x2nx)T...(xm1,xm2,xm3...xmnx)T):(nx,m)
此时,各层神经网络:
Z [ L ] = W [ L ] ∗ A [ L − 1 ] + b [ L ] Z^{[L]}=W^{[L]}*A^{[L-1]}+b^{[L]} Z[L]=W[L]A[L1]+b[L]
各矩阵维度:
Z [ L ] : ( n [ L ] , m ) A [ L − 1 ] : ( n [ L − 1 ] , m ) W [ L ] : ( n ( L ) , n ( L − 1 ) ) b [ L ] : ( n [ L ] , 1 ) Z^{[L]}:(n^{[L]},m)\\ A^{[L-1]}:(n^{[L-1]},m)\\ W^{[L]}:(n^{(L)},n^{(L-1)})\\ b^{[L]}:(n^{[L]},1) Z[L]:(n[L],m)A[L1]:(n[L1],m)W[L]:(n(L),n(L1))b[L]:(n[L],1)

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值