机器学习（深度学习）缓解过拟合的方法——正则化及L1L2范数详解

最新推荐文章于 2024-08-15 11:06:20 发布

Tianlock

最新推荐文章于 2024-08-15 11:06:20 发布

阅读量1k

点赞数 3

分类专栏：学习总结

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Tianlock/article/details/88421274

版权

本文探讨了正则化在机器学习特别是深度学习中防止过拟合的作用，重点讲解了L1和L2范数。L1范数促使权重稀疏，利于特征选择；L2范数通过权重衰减避免过拟合，同时解决了矩阵求逆的难题。这两种范数有助于构建简单且泛化能力更强的模型。

摘要由CSDN通过智能技术生成

机器学习（深度学习）缓解过拟合的方法——正则化

- L1范数和L2范数
- - L1范数
  - L2范数

过拟合的本质：模型对于噪声过于敏感，把训练样本里的噪声当做特征进行学习，以至于在测试集的表现不好，加入正则化后，当输入有轻微的改动，结果受到的影响较小。
正则化的方法主要有以下几种：

参数范数惩罚，比较好理解，将范数加入目标函数（损失函数），常见的有一范数，二范数
数据集增强
添加噪声
earlystopping，当验证集的效果下降，而训练集还未收敛，提前终止训练
模型的融合，bagging方法
Dropout（类似于bagging多个神经网络）
Batch Normalization
简化网络结构
本文接下来将详细介绍L1范数和L2范数，其他的正则化方法比较好理解，就不在详述

L1范数和L2范数

有监督的机器学习问题主要有两个任务：最小化误差和规则化参数。最小化误差主要是为了让模型拟合我们的训练数据，规则化参数是防止模型过分拟合训练数据。因为参数太多，会导致我们的模型复杂度上升，容易过拟合，也就是我们的训练误差会很小。但训练误差小并不是我们的最终目标，我们的目标是希望模型的测试误差小，也就是能准确的预测新的样本。所以，我们需要保证模型“简单”的基础上最小化训练误差，这样得到的参数才具有好的泛化性能（也就是测试误差也小），而模型“简单”就是通过规则函数来实现的。

最低0.47元/天解锁文章

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。