c++ 多项式拟合_机器学习的基本概念（一）：过拟合（Overfit）

最新推荐文章于 2024-05-30 09:42:44 发布

weixin_39887386

最新推荐文章于 2024-05-30 09:42:44 发布

阅读量1.5k

点赞数 1

文章标签： c++ 多项式拟合

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39887386/article/details/112774325

版权

本文介绍了机器学习中的过拟合问题，通过实例分析了多项式拟合过程中如何从欠拟合到过拟合的过程，强调了过拟合对预测能力的影响及其与模型泛化能力的关系。此外，还提及了防止过拟合的方法，如K近邻算法的K值选择、决策树的修剪、神经网络的早停策略等。

摘要由CSDN通过智能技术生成

机器学习及R应用五天现场班

陈强亲授

北京, 2021年1月20-24日

Now or Never!

陈强老师的《机器学习及R应用》(高教社，2020年11月，458页，双色印刷)已经上市啦！目前已在京东与当当自营销售。配套五天现场班即将于2021年1月20日在北京拉开序幕，无疑这是快速上手机器学习及R应用的捷径啊……

从本期开始，将陆续介绍机器学习的若干基本概念，帮助大家逐渐掌握机器学习的视角与方法。

或许你已经上过多门计量经济学的课程，却很少听老师们说起“过拟合”(overfit)的问题。另一方面，“过拟合”却是机器学习重要的基本概念。何以如此？

根本原因在于，机器学习的主要目的在于预测，而过拟合则是预测的大敌。不妨来看下图。考虑使用下图中的散点信息，找到使用X(横轴变量)预测Y(纵轴变量)的最佳函数关系。

在最右边的小图，使用一条水平线来拟合散点(限制直线的斜率为0)，导致无法抓住数据的主要特征，故处于“欠拟合”(underfitting)的状态。中间的小图，则较好地抓住了数据的特征，故处于“拟合良好”(good fit，optimal fit)的状态。

在另一个极端，最左边的小图中，拟合函数过于“拐弯”，虽然完美地拟合了散点(样本内的训练误差为0)，但预测能力可能较差(样本外的测试误差较大)，因为图中散点的那些“拐弯”很可能是噪音(noise)所致，并非数据中的固有信号(signal)，故一般不会在未来没见过的数据(unseen data)中重现这些随机出现的特点。

以《机器学习及R应用》(陈强，2020)第4章的案例为例(细节与R代码均

最低0.47元/天解锁文章

weixin_39887386

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
c++ 多项式拟合_机器学习的基本概念（一）：过拟合（Overfit）

机器学习及R应用五天现场班陈强亲授北京, 2021年1月20-24日Now or Never!陈强老师的《机器学习及R应用》(高教社，2020年11月，458页，双色印刷)已经上市啦！目前已在京东与当当自营销售。配套五天现场班即将于2021年1月20日在北京拉开序幕，无疑这是快速上手机器学习及R应用的捷径啊……从本期开始，将陆续介绍机器学习的若干基本概念，帮助大家逐渐掌握机器学习的视...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。