深度学习中的正则化

Iris_6713

于 2020-06-28 21:18:47 发布

阅读量439

点赞数

分类专栏：深度学习基础文章标签：深度学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Iris_6713/article/details/106985327

版权

正则化是控制模型复杂度，防止过拟合的重要方法。本文介绍了正则化的概念，强调了对权重而非偏置进行惩罚的原因，并列举了L1、L2正则化、数据增强、噪声注入等常见正则化策略，帮助理解如何提升模型的泛化能力。

摘要由CSDN通过智能技术生成

为什么要研究正则化？

机器学习需要找到的是从训练数据分布上学习一些特征且能在新数据上泛化好的算法。泛化好的算法我们才能用来对未知数据做预测。

但在实践中，我们有太多可选择的函数来拟合训练数据与对应结果之间的关系，即便选定某一种函数，这个函数的具体形式也是有很多种的。
在这里插入图片描述
这些不确定因素导致模型容量很不容易控制，对训练数据学习特征的多少很不容易把握，有时学到特征太少了（欠拟合），在训练集上都表现不好，有时学到的特征太多了，噪声特征也学到了（过拟合），导致模型在训练数据上表现很好，但在测试数据上较差。很难做到恰恰好。

正则化策略就是将过拟合情况变成正常拟合情况最常用也是很有效的一种方式。当然解决过拟合的方法还有好多。

什么是正则化？

Deep Learning中正则化定义大意是对算法的修改达到减少泛化误差的目的（可能会增大训练误差为代价）。

过拟合就是模型容量太大导致对训练数据学到了太多噪声特征，正则化就是将我们对特定任务的先验知识通过约束和惩罚的形式达到控制模型容量的目的，最终实现提高泛化能力的效果，帮助我们选择到在特定任务上更合适的模型。
常用的正则化手段如下：

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。