深度学习中的正则化方法

浅梦s

已于 2022-10-01 16:05:00 修改

阅读量2.8k

点赞数 2

分类专栏：深度学习 # 深度学习基础文章标签：深度学习机器学习人工智能

于 2017-10-01 23:39:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012151283/article/details/78149466

版权

本文详细介绍了深度学习中的正则化方法，包括L2参数正则化、Dropout、数据集增强和提前终止等策略。L2正则化通过惩罚权重范数来防止过拟合，Dropout通过随机失活神经元实现模型集成。数据集增强通过增加数据多样性提高模型泛化能力，提前终止则在验证集误差不再下降时停止训练，以防止过拟合。此外，文中还探讨了其他正则化技术的应用和效果。

摘要由CSDN通过智能技术生成

引入正则化

在深度学习背景下，大多数正则化策略都会对估计进行正则化。估计的正则化以偏差的增加换取方差的减少。一个有效的正则化是有利的权衡，也就是能显著减少方差而不过度增加偏差。

参数范数惩罚

许多正则化方法通过对目标函数 $J$ 添加一个参数范数惩罚 $\Omega(\theta)$ ，限制模型的学习能力。正则化后的目标函数记为 $\tilde{J}$
$\tilde{J}(\theta;X,y)= J(\theta;X,y)+\alpha\Omega(\theta)$

通常，在神经网络中只对每一层仿射变换的_权重_做惩罚而不对偏置做惩罚。精确拟合偏置所需的数据通常比拟合权重少得多。正则化偏置参数可能会导致明显的欠拟合。
在神经网络中，为了减少搜索空间，通常在所有层使用相同的权重衰减。

L2参数正则化

L2正则化通过向目标函数添加一个正则项 $\Omega(\theta)=\frac{1}{2}||w||_2^2$ ，使权重更加接近原点，又称为岭回归或Tikhonov正则。
假定模型没有偏置参数，因此

最低0.47元/天解锁文章

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。