吴恩达深度学习L2W1总结

qq_45602850

已于 2022-03-28 11:35:57 修改

阅读量185

点赞数

分类专栏：深度学习文章标签：深度学习矩阵 python

于 2022-03-28 11:33:31 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45602850/article/details/123786956

版权

深度学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

作业1：初始化

不同的初始化会导致不同的结果
随机初始化用于打破对称性，并确保不同的隐藏单元可以学习不同的东西
不要初始化为太大的值
随机初始化对于带有ReLU激活的网络非常有效

Xavier初始化还不会！！！

作业2：正则化

正则化将帮助减少过拟合。
正则化将使权重降低到较低的值。
L2正则化和Dropout是两种非常有效的正则化技术

L2正则化的影响：

损失计算：
- 正则化条件会添加到损失函数中
反向传播函数：
- 有关权重矩阵的渐变中还有其他术语
权重最终变小（“权重衰减”）：
- 权重被推到较小的值。

Dropout
Dropout是广泛用于深度学习的正则化技术。它会在每次迭代中随机关闭一些神经元。

使用dropout时的常见错误是在训练和测试中都使用。你只能在训练中使用dropout（随机删除节点）

作业三：梯度检验

梯度检验可验证反向传播的梯度与梯度的数值近似值之间的接近度（使用正向传播进行计算）
梯度检验很慢，因此我们不会在每次训练中都运行它。通常，你仅需确保其代码正确即可运行它，然后将其关闭并将backprop用于实际的学习过程。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吴恩达深度学习L2W1总结

作业1：初始化不同的初始化会导致不同的结果随机初始化用于打破对称性，并确保不同的隐藏单元可以学习不同的东西不要初始化为太大的值随机初始化对于带有ReLU激活的网络非常有效Xavier初始化还不会！！！作业2：正则化正则化将帮助减少过拟合。正则化将使权重降低到较低的值。L2正则化和Dropout是两种非常有效的正则化技术L2正则化的影响：损失计算：- 正则化条件会添加到损失函数中反向传播函数：- 有关权重矩阵的渐变中还有其他术语权重最终变小（“权重衰减”）：- 权
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。