原因就是:此处W和小w不是一个概念,w是每一个神经元中附带的用于正向传播过程中的参数,W是同一层神经元的向量化集合。
w是行向量,W是一个矩阵,W的列数=w列数,W的行数是同一层中神经元的个数。
每一层的神经网络的W不同,在隐藏层可能有n个神经元,所以W的行数为n,但是输出层只有一个神经元,所以W是一个行向量。
原因就是:此处W和小w不是一个概念,w是每一个神经元中附带的用于正向传播过程中的参数,W是同一层神经元的向量化集合。
w是行向量,W是一个矩阵,W的列数=w列数,W的行数是同一层中神经元的个数。
每一层的神经网络的W不同,在隐藏层可能有n个神经元,所以W的行数为n,但是输出层只有一个神经元,所以W是一个行向量。