深度学习提高泛化能力的技术

最新推荐文章于 2024-08-16 14:16:25 发布

视界IT

最新推荐文章于 2024-08-16 14:16:25 发布

阅读量2.3w

点赞数 12

分类专栏：算法梳理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41725746/article/details/89296943

版权

本文探讨了深度学习模型的泛化能力，包括过拟合和欠拟合的概念。正则化是提高泛化能力的重要手段，分为参数正则化（如L1/L2正则化）、经验正则化（如提前终止和模型集成，特别是dropout技术）和隐式正则化（如数据增强）。dropout通过随机丢弃神经元来降低模型复杂度，防止过拟合。

摘要由CSDN通过智能技术生成

LeetCode题目记录

1.泛化能力（generalization）
2.正则化（regularization）
- 2.1 正则化方法

1.泛化能力（generalization）

对于模型，我们不仅要求它对训练数据集有很好的拟合（训练误差），同时也希望它可以对未知数据集（预测集）有很好的拟合结果（泛化能力），所产生的测试误差被称为泛化误差。
度量泛化能力的好坏，最直观的表现就是模型的过拟合（overfitting）和欠拟合（underfitting）

过拟合和欠拟合是用于描述模型在训练过程中的两种状态，一般来说，训练会是这样的一个曲线。下面的training error，generalization error分别是训练集和测试集的误差。

在这里插入图片描述

训练刚开始的时候，模型还在学习过程中，训练集和测试集的性能都比较差，这个时候，模型还没有学习到知识，处于欠拟合状态，曲线落在underfitting zone，随着训练的进行，训练误差和测试误差都下降。

随着模型的进一步训练，在训练集上表现的越来越好，终于在突破一个点之后，训练集的误差下降，测试集的误差上升了，这个时候就进入了过拟合区间overfitting zone。

不过也不是说什么训练过程，都会满足上面的曲线。

(1) 模型训练过程中，训练集的误差一定一直低于测试集吗？未必。

如果这两个集合本来就取自于同样的数据分布，比如从一个数据集中随机采样，那么有可能测试的误差从一开始就低于训练集。不过，总体的趋势肯定是不变的，两者从一开始慢慢下降直到最后过拟合，训练集的误差低于测试集。

(2) 模型的训练一定会过拟合吗？这也不一定！

如果数据集足够大，很可能模型的能力不够始终都不会过拟合。另一方面，有很多的方法可以阻止，或者减缓模型的过拟合，比如正则化。

2.正则化（regularization）

正则化的目标: 模型的经验风险和模型复杂度之和达到最小，即结构风险达到最小。

最低0.47元/天解锁文章

关注

12
点赞
踩
83

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。