解决数据泛化问题

时隔一年多,再次记录最近遇到的问题
最近在弄毕业设计,其中就遇到一个很头疼的问题,训练的时候好好的。
请添加图片描述

请添加图片描述

但是最后跑模型的时候发现实际的效果差的多如下
请添加图片描述
请添加图片描述
真的要被无语死了
首先跟大家解释一下啥叫数据泛化的问题

泛化问题在机器学习和深度学习中是一个普遍存在的挑战。它指的是模型在训练集上表现良好,但在未见过的测试数据上表现不佳的情况。以下是导致泛化问题的一些常见原因:

理性的分析了一下结果,能被我检索到的如下

1.数据不足或不平衡:当训练数据量不足或者不平衡(各类别样本数量差异过大)时,模型可能无法捕捉到数据的真实分布,导致泛化性能下降。

2.过拟合(Overfitting):模型过度拟合了训练数据的噪声或特定样本的特征,而忽略了真实数据的整体分布。这会导致模型在训练集上表现很好,但在测试集上泛化能力较差。

3.模型复杂度过高:当模型的复杂度过高时,例如神经网络的层数过多或者参数量过大,容易导致过拟合,使得模型在未见过的数据上泛化能力较差。

4.数据分布偏移(Distribution Shift):当训练集和测试集的数据分布不一致时,模型在训练集上学到的特征可能无法有效地推广到测试集上,导致泛化性能下降。

5.特征选择不当:选择的特征可能不够代表真实数据的关键信息,或者包含了与任务无关的噪声,这会影响模型的泛化能力。

6.训练过程中的随机性:某些算法(如随机初始化权重、随机梯度下降等)在训练过程中引入了随机性,这可能导致模型在不同训练过程中学到不同的特征,影响泛化性能。

这是官方的解释,于是我采取最简单粗暴的方式
多训练,增加训练批次,强制解决!由最开始的150epoch增加到450epoch
最后的结果,有用的,强制解决部分数据泛化的问题

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值