防止过拟合(overfitting)的方法

最新推荐文章于 2024-08-09 00:47:47 发布

ethan_sui

最新推荐文章于 2024-08-09 00:47:47 发布

阅读量1.2w

点赞数 3

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ethan_sui/article/details/105159908

版权

深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

过拟合是什么？

有一句话这么描述过拟合：“过拟合是指为了得到一致假设而使假设变得过度严格。”在深度学习领域常常表现在：训练好的模型在训练集上表现良好，而在测试集上效果很差，即存在过拟合的模型不是一个好模型。
举个例子：给出一些特征让模型判别，特征有：两只胳膊、两条腿、直立行走、有学习能力、高级动物、有胡子、说汉语、有教师资格证、有个读高中的孩子。

Normal fitting：判定这是一个人，判断理由：有两只胳膊、两条腿，有学习能力，可以直立行走，是高级动物

overfitting：判定这是一个人，判断理由：有两只胳膊、两条腿，有胡子，有学习能力，可以直立行走，是高级动物，会说汉语

serious overfitting：判定这是一个人，判断理由：有两只胳膊、两条腿，有胡子，有学习能力，可以直立行走，是高级动物，会说汉语，有教师资格证，还有个读高中的孩子

虽说这三个判定都是人，但是后面的两个判定是基于模型学习了更深层次更复杂的特征。但如果说我的对这个模型的初衷只是想能够判断某个事物是人还是动物，那么存在过拟合的模型如果看不到有胡子、说汉语或者有教师资格证、有个读高中的孩子等特征，就不认为这是一个人，但是没有胡子，不说汉语也可以是一个人啊，所以这就不是一个好模型，存在过拟合问题，应该尽量避免过拟合。

一些防止过拟合的措施

数据增广
想训练一个良好的模型，一个足够广泛完备的数据集是基础，举个例子，过拟合其实就可以认为是模型是一只青蛙🐸在坐井观天，认识的太片面，太局限。而数据增广就相当于把青蛙放在井外面的大千世界中去，去更全面的认知事物。
但是现实生活中，由于种种限制，往往搜集不到足够完备的数据集，假设是图像数据，这个时候就可以通过平移、旋转、缩放、切割、加入高斯噪声等手段将数据集进行扩充。
Dropout
Dropout方法通过修改隐藏层神经元的个数来防止网络的过拟合，也就是通过修改深度网络本身。在训练过程中按照给定的概率随机删除一些隐藏层的神经元，同时保证输入层和输出层的神经元不变，从而简化了网络的复杂度。Dropout主要广泛应用于全连接网络中。
正则化
通常使用L1范数和L2范数进行正则化，L1范数可以稀疏网络，一定程度上防止过拟合，L2范数可以降低对数据的敏感度，提高模型的泛化能力，更能防止过拟合。
多任务学习
将总任务分成多个小任务同时学习，模型最终认可的是多个任务的共同、一致的表示，从而使得模型在原始任务上的过拟合风险变小。

相关题目

可以解决Overfitting的方法有？

Dropout
BatchNorm
增加模型参数量
增加数据量

个人网站

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。