过拟合 特征值 特征向量

过拟合,欠拟合

一.什么是过拟合,欠拟合

1.过拟合:对训练集特征的过度学习,仅仅适合此训练集,在泛化使用的时候不能用于其他的数据集判断.
2.欠拟合:对于训练集特征学习的欠缺,同样不适用于其他数据集的判断
.

用一个表格来解释过拟合,欠拟合

训练集上的表现 测试集上的表现 结论
不好 不好 欠拟合
不好 过拟合
适度拟合

二.过拟合的产生

  1. 训练集的数量级和模型的复杂度不匹配。训练集的数量级要小于模型的复杂度;

  2. 训练集和测试集特征分布不一致;

  3. 样本中的噪音数据干扰过大,大到模型过分记住了噪音特征,导致多余的记录;

  4. 权值学习迭代次数足够多(Overtraining),拟合了训练数据中的噪声和训练样例中没有代表性的特征。

总结来说主要原因在于:1训练数据中存在噪音 2.训练集太少

三.处理过拟合

1.丢弃一些不能帮助正确预测的特征,减小模型的复杂度(减小宽度和减小深度)

2.增加训练集的数量,减少过度学习的概率

3.正则化,保留所有的特征,减少参数的大小,或则使用一些模型选择的算法

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值