浅谈过度拟合

本文探讨了过度拟合的概念,指出其在机器学习中导致模型在训练数据上表现优秀,但在测试数据上表现不佳的问题。决策树和人工神经网络是两个容易发生过度拟合的算法,其成因包括训练样本中的噪声和数量不足。解决方案包括决策树的后修剪法以及在神经网络中引入SVM。强调使用验证集合来检测过度拟合的重要性。
摘要由CSDN通过智能技术生成
主要参考书 《Machine Learning》Tom M.Mitchell

过度拟合现象描述:
  死扣细节而忽略其他更重要的问题,过度在意细节而忽略大趋势。
  或者说,当数据中有噪声或训练样例的数量太少以至于不能产生目标函数的有代表性的条件时,策略会遇到困难。

决策树

  现象:
    算法在训练样例上表现很好,在测试样例上表现不好。
   
    看张图,来自参考书中:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值