过度拟合-不要想太多

62 篇文章 1 订阅
62 篇文章 1 订阅

过度拟合

在编程领域中它指的是所选模型的复杂度比真实模型更高;学习时选择的模型所包含的参数过多,对已经数据预测得很好,但是对未知数据预测得很差的现象。

比如说机器学习,当模型在训练数据上表现良好但对不可见数据的泛化能力很差时,就会发生过度拟合。过度拟合是机器学习中非常普遍的问题。

防止过度拟合

例如,许多预测算法都是先寻找单一的最重要的因素,而不是直接跳跃到多因素模型。只有找到第一个因素后,才会去寻找第二重要的因素添加至模型,然后再找下一个。因此,在过度拟合有机会出现之前,它们的模型可以让过程在短时间内停止,阻止过程变得过于复杂刻意。计算预测的一个相关方法在一次只考虑一个数据点,模型在添加更多的数据点之前

会调整到新的点。同样在那种情况下,模型的复杂性逐渐增加,所以将过程停止并变短有助于防止过度拟合。

书中例举了一些例子,外界的观点、看法影响着每个人,比如我们应该把什么吃进我们的身体里,似乎很奇怪地都被那些昙花一现的潮流主宰着。使这些潮流席卷世界的部分原因是我们的文化能迅速做出改变。现在,信息比以往任何时候都更快地渗透到社会中,而全球供应链使消费者能够迅速改变他们的购买习惯(市场营销也鼓励他们这样做)。如果有特别的研究正好表明某些东西对健康有益,例如八角,它便会在一周内充整个博客,下一周就开始登上电视节目,并在6个月内出现在几乎每一家超市,接下来就有专门的八角食谱出版。这惊人的速度既是幸事又是一种祸害。

实际生活中,当人们要做出决定时也是这样。

如果你了解到全部的事实和数据,那么当然是考虑得越多越好,但如果你了解到的信息越不全面,不确定性越大,那么过多的思考将会带来的是内心的纠结,而且也不一定能得到你想要的结果。

当你真正处于黑暗中,最好的计划将是最简单的。当我们对预期不确定,而且得到的数 据杂乱无章时,最好的办法就是用一支粗的画笔来画画,用宽大的笔触来思考。有时候,照 字面意思来处理就行。正如企业家杰森·弗里德和戴维·H.汉森解释的那样,在他们需要头脑风暴的时候,他们就会用越粗的笔(这是一种用来表达简单化的聪明的方式): 当我们开始设计某样东西时,我们会用一个大而粗的记号笔勾勒出一些想法,而不是圆 珠笔。为什么呢?因为圆珠笔的笔尖太细了。它们的分辨率太高。它们会促使你担心一些你不应该担心的事情,比如完善阴影,或者使用虚线。你最终会专注于那些不应该关注的事 情。记号笔不会局限住我们。你只能画出形状、线条和盒子。这很好。你最开始应该担心的是大局。又或说需要去发掘那些真正能影响结果的重要因素,可以把它列在一张纸上,其他那些没有出现在纸上的东西,就不必考虑在内了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

蜗牛慢慢向上爬

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值