在一个形如 y = W2 * α(W1 * x + b)的分类器中, W1参数矩阵(hidden layer L1)的行数代表着该层多个neuron的并行计算; x input矩阵的列数代表着一个mini-batch的所有samples的并行计算;