过拟合问题及解决办法

最新推荐文章于 2023-12-08 11:50:46 发布

liubo187

最新推荐文章于 2023-12-08 11:50:46 发布

阅读量1.3w

点赞数 2

分类专栏： machine learning 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liubo187/article/details/77092729

版权

machine learning 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1 什么是过拟合？

一般提及到过拟合就是说在训练集上模型表现很好，但是在测试集上效果很差，即模型的泛化能力不行。过拟合是模型训练过程中参数拟合的问题，由于训练数据本身有采样误差，拟合模型参数时这些采样误差都拟合进去就会带来所谓的过拟合问题。

2 机器学习中为什么会容易出现过拟合？

传统的函数拟合问题，一般是通过物理、数学等推导出的一个含参数的模型（数学建模），模型复杂度是确定的，没有多余的能力拟合噪声。而机器学习算法的复杂度更高，一般都远高于具体问题的复杂度。也就说数据量不足有支撑庞大的模型（也可以说是参数）。

3 怎么样解决过拟合？

3.1 获取更多的数据

一方面可以获取更多的源数据，另一方面也可以在现有数据的基础上进行数据增强（图像平移，旋转等）

3.2 使用合适的模型

这主要是解决数据量与模型参数之间的矛盾，即固定数据量只能支撑对应的参数量的模型的拟合（通俗的说，几十个几百个数据就不要使用深度网络了）。该方法主要可以从四个方面入手：

a.简化网络结构，如层数，单层神经元个数

b.early stopping，每个神经元激活函数在不同数值区间的性能是不同的，值较小时为线性区，适当增大后为非线性区，过度增大则为饱合区（梯度消失）。初始化时，神经元一般工作在线性区（拟合能力有限），训练时间增大时，部分值会增大进入非线性区（拟合能力提高），但是训练时间过大时，就会进入饱合区，神经元就“死掉”。所以应该在适当时间内就stopping训练。

c.限制权值，正则化

d.增加噪声：在输入中增加噪声（效果类似正则化）；在权值中加入噪声（非零初始化）；

3.3 集成多种模型

a.bagging，类似于分段函数的概念，不同部分的训练集使用不同模型拟合；

b.boosting，综合多个简单的模型的结果得到一个‘靠谱的结果’

c.dropout，实际效果其实是用不同的训练集训练了不同的网络模型，然后这些网络模型形成了一个整体的模型

3.4 贝叶斯方法

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

liubo187 CSDN认证博客专家 CSDN认证企业博客

码龄9年

5: 原创

61万+: 周排名

114万+: 总排名

4万+: 访问

: 等级

393: 积分

2: 粉丝

20: 获赞

4: 评论

57: 收藏

私信

关注

热门文章

分类专栏

最新评论

多标签图像分类任务的评价方法——mAP
Xavier学长: 是楼主写错了，参考代码： def average_precision(output, target): epsilon = 1e-8 # sort examples indices = output.argsort()[::-1] # Computes prec@i total_count_ = np.cumsum(np.ones((len(output), 1))) target_ = target[indices] ind = target_ == 1 pos_count_ = np.cumsum(ind) total = pos_count_[-1] pos_count_[np.logical_not(ind)] = 0 pp = pos_count_ / total_count_ precision_at_i_ = np.sum(pp) precision_at_i = precision_at_i_ / (total + epsilon) return precision_at_i
多标签图像分类任务的评价方法——mAP
sinat_26482989: 你好，有没有源码或者Git
多标签图像分类任务的评价方法——mAP
年纪轻轻keep_coding: 您好,那张彩色的表,top-N的第6行的Max Precision for any recall r' >= r 的值是不是应该是3/6?
pycharm安装
chunmengren: 博主你好，我在Ubuntu上安装使用pycharm，选中某个单词，其他的相同的单词为什么不能被同时选中？应该怎样设置？谢谢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。