1.初始权值设置成rand
使得W服从“0~1”均匀分布的随机样本值,导致Z成为
从2.78-38.338 。不会收敛
2.dA不更新
这里dA一直都是dA^[5]不会更新导致了下降不下去,改成i+2就解决了
3.cost不收敛
原因是 没有用dA,用的A从而没产生梯度下降
修改后cost如下
1.初始权值设置成rand
使得W服从“0~1”均匀分布的随机样本值,导致Z成为
从2.78-38.338 。不会收敛
2.dA不更新
这里dA一直都是dA^[5]不会更新导致了下降不下去,改成i+2就解决了
3.cost不收敛
原因是 没有用dA,用的A从而没产生梯度下降
修改后cost如下