吴恩达2017深度学习作业-c2w1-Optimization Methods（下）

最新推荐文章于 2024-02-27 00:44:08 发布

快乐成长吧

最新推荐文章于 2024-02-27 00:44:08 发布

阅读量370

点赞数 1

分类专栏： 2017吴恩达深度学习

本文链接：https://blog.csdn.net/qq_37791134/article/details/93675956

版权

该博客详细介绍了在吴恩达的深度学习课程中，针对"moons"数据集使用不同优化算法（小批量梯度下降、带动量的小批量梯度下降和Adam）训练3层神经网络的过程。通过实验，发现Adam在性能上优于其他两种方法，尤其是在收敛速度上。此外，还提到了Adam的内存需求和超参数调优的优势。

摘要由CSDN通过智能技术生成

这次作业其实总的来说花费了很长时间，主要是自己不能集中去写代码，第二是基础知识很多不扎实，很多需要查，但是我查也不是深究，我就简单记录一下用法，主要还是需要多用。每次都小结一下。

前面一些错误的点：

 s["dW" + str(l+1)] = beta2 * s["dW" + str(l+1)] + (1-beta2)* np.square(grads["dW" + str(l+1)])
 #s["db" + str(l+1)] = beta2 * s["db" + str(l+1)] + (1-beta2)* math.pow(grads["db" + str(l+1)],2) 错啦

 v_corrected["dW" + str(l+1)] = v["dW" + str(l+1)] / (1 - np.power(beta1,t))
#v_corrected["db" + str(l+1)] = v["db" + str(l+1)] / (1 - math.pow(beta1,l)) 错啦

新的写法：

  s["dW"+str(l+1)]=np.zeros((parameters["W"+str(l+1)].shape[0],parameters["W"+str(l+1)].shape[1]))
  s["db" + str(l+1)] = np.zeros_like(parameters['b'+ str(l+1)])