深度学习笔记(5.numpy实现DNN正则化)

最新推荐文章于 2023-04-18 14:29:45 发布

迷茫猿小明

最新推荐文章于 2023-04-18 14:29:45 发布

阅读量858

点赞数

分类专栏：深度学习文章标签：深度学习 DNN 正则化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bjjoy2009/article/details/101998571

版权

深度学习专栏收录该内容

16 篇文章 11 订阅

订阅专栏

前言

深度学习课程第二部分：改善神经网络：超参数调试、正则化以及优化，第一周深度学习的使用层面。实现2种正则化方法（L2和dropout），实现课程中讲到的权重初始化方法。
程序地址：https://github.com/ConstellationBJUT/Coursera-DL-Study-Notes

正则化

1、L2_regularization
由于损失函数添加正则项，这部分涉及到损失函数和反向传播程序的修改。
（1）损失函数修改
在这里插入图片描述
（2）反向传播修改
算是函数多了权重W项，每层dW需要添加Wl相关项。

2、dropout
这部分涉及前向传播和反向传播的修改，添加了关闭矩阵D。只作用在hidden layer。
（1）正向传播修改

（2）反向传播修改
在这里插入图片描述

实验结果和结论

本地实现和课件所给程序基本一致。dropout部分，前几千次迭代一致，3500次迭代后损失出现了nan，还没找出具体原因。
第2000次迭代：课件损失0.10396707442900771，本地损失0.10396707442900772。只有最后一位不同，哎！！！
第20000次迭代，课件损失0.06，本地损失nan。
这里dropout迭代次数取3546，损失nan前一次。
在这里插入图片描述
课件给出的结果

迷茫猿小明

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
深度学习笔记(5.numpy实现DNN正则化)

学习Andrew Ng课程——改善深层神经网络，numpy实现正则化。在上一周dnn代码基础上，添加L2 regularization和dropout正则化方法。根据课件实验数据实现二分类。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。