深度学习笔记2之改善神经网络（调参、优化）

最新推荐文章于 2023-12-25 09:34:21 发布

菜鸟中的菜中菜

最新推荐文章于 2023-12-25 09:34:21 发布

阅读量899

点赞数

分类专栏：深度学习文章标签：深度学习神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44176643/article/details/121149553

版权

本文详细介绍了深度学习中减少过拟合的正则化方法，包括L2正则化和Dropout，以及如何通过归一化输入、选择合适的batch size、优化算法（如Adam）来改善神经网络的性能。此外，还讨论了学习率衰减和局部最优问题的解决方案。

摘要由CSDN通过智能技术生成

第二课

week1

偏差和方差

在这里插入图片描述
机器学习关键：数据集，选择网络，正则化。来解决偏差和方差

正则化

在这里插入图片描述
$\lambda$ 是正则化参数，L2正则化是使用了欧几里德范数（2范数）的平方，L1是加了L1范数，w会是稀疏的，会有很多0，却没有降低太多内存，人们更倾向L2

为什么L2正则化可以减少过拟合：

如果正则化参数变得很大，参数 w 很小， z 也会相对变小，此时忽略 b 的影响， z 会相对变小，
z 的取值范围很小，这个激活函数，也就是曲线函数tanh 会相对呈线性，整个神经网络会计算离线性函数近的值，这个线性函数非常简单，并不是一个极复杂的高度非线性函数（不像前面那个高方差的样子，曲线特别离谱），不会发生过拟合

Dropout正则化

本质： 随机失活
首先要定义向量 $d^{[3]}$ 表示一个三层的dropout向量：

d3=np.random.rand(a3.shape[0],a3.shape[1])

然后看它是否小于某数，我们称之为keep-prob，keep-prob是一个具体数字，上个示例中它是0.5，而本例中它是0.8，它表示保留某个隐藏单元的概率，此处keep-prob等于0.8，它意味着消除任意一个隐藏单元的概率是0.2，它的作用就是生成随机矩阵，如果对 $a^{[3]}$ 进行因子分解，效果也是一样的。 $d^{[3]}$ 是一个矩阵，每个样本和每个隐藏单元，其中 $d^{[3]}$

最低0.47元/天解锁文章

菜鸟中的菜中菜

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习笔记2之改善神经网络（调参、优化）

第二课week1偏差和方差机器学习关键：数据集，选择网络，正则化。来解决偏差和方差正则化λ\lambdaλ 是正则化参数，L2正则化是使用了欧几里德范数（2范数）的平方，L1是加了L1范数，w会是稀疏的，会有很多0，却没有降低太多内存，人们更倾向L2为什么L2正则化可以减少过拟合：如果正则化参数变得很大，参数 w 很小， z 也会相对变小，此时忽略 b 的影响， z 会相对变小，z 的取值范围很小，这个激活函数，也就是曲线函数tanh 会相对呈线性，整个神经网络会计算离线性函数
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。