问题描述
吴恩达《深度学习》编程作业L1W4的作业1中,L层神经网络 初始化使用的代码:
def initialize_parameters_deep(layer_dims):
np.random.seed(3)
parameters = {}
L = len(layer_dims)
for l in range(1, L):
parameters['W' + str(l)] = np.random.randn(layer_dims[l],layer_dims[l-1]) * 0.01
parameters['b' + str(l)] = np.zeros((layer_dims[l],1))
return parameters
注意:其中W初始化时,np.random.randn(layer_dims[l],layer_dims[l-1]) * 0.01
那么在L1W4作业2中,我理所当然的也用了 * 0.01,最后的结果为:
训练集: Accuracy: 0.66
测试集: Accuracy: 0.34
与答案给出的预期输出:
0次迭代后的损失:
0.6930497356599888
100次迭代后的损失:
0.6464320953428849
…
2400次迭代后的损失:
0.04855478562877020