c++ 多项式拟合_机器学习的基本概念(一):过拟合(Overfit)

本文介绍了机器学习中的过拟合问题,通过实例分析了多项式拟合过程中如何从欠拟合到过拟合的过程,强调了过拟合对预测能力的影响及其与模型泛化能力的关系。此外,还提及了防止过拟合的方法,如K近邻算法的K值选择、决策树的修剪、神经网络的早停策略等。
摘要由CSDN通过智能技术生成

机器学习及R应用五天现场班

陈强  亲授

北京, 2021年1月20-24日

Now or Never!

a5850c4a0ab4807a72dfc3cb75952360.png

陈强老师的《机器学习及R应用》(高教社,2020年11月,458页,双色印刷)已经上市啦!目前已在京东与当当自营销售。配套五天现场班即将于2021年1月20日在北京拉开序幕,无疑这是快速上手机器学习及R应用的捷径啊……


从本期开始,将陆续介绍机器学习的若干基本概念,帮助大家逐渐掌握机器学习的视角与方法。

或许你已经上过多门计量经济学的课程,却很少听老师们说起“过拟合”(overfit)的问题。另一方面,“过拟合”却是机器学习重要的基本概念。何以如此?

根本原因在于,机器学习的主要目的在于预测,而过拟合则是预测的大敌。不妨来看下图。考虑使用下图中的散点信息,找到使用X(横轴变量)预测Y(纵轴变量)的最佳函数关系。

8d2ddf324b069d636045679f1a0bc4d3.png

在最右边的小图,使用一条水平线来拟合散点(限制直线的斜率为0),导致无法抓住数据的主要特征,故处于“欠拟合”(underfitting)的状态。中间的小图,则较好地抓住了数据的特征,故处于“拟合良好”(good fit,optimal fit)的状态。

在另一个极端,最左边的小图中,拟合函数过于“拐弯”,虽然完美地拟合了散点(样本内的训练误差为0),但预测能力可能较差(样本外的测试误差较大),因为图中散点的那些“拐弯”很可能是噪音(noise)所致,并非数据中的固有信号(signal),故一般不会在未来没见过的数据(unseen data)中重现这些随机出现的特点。

以《机器学习及R应用》(陈强,2020)第4章的案例为例(细节与R代码均

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
#ifndef FUNCTION_H_ #define FUNCTION_H_ #include #include #include "polyfit.h" #include using namespace std; dxs::dxs() { ifstream fin("多项式拟合.txt"); fin>>n; x=new float[n]; y=new float[n]; for(int i=0;i>x[i]; } for(i=0;i>y[i]; } cout<>nn; m=nn+1; u=new float*[m]; for(i=0;i<m;i++) { u[i]=new float[m+1]; }//创建m行,m+1列数组 } void dxs::dfine() { for(int i=0;i<m;i++) { for(int j=0;j<m+1;j++) { u[i][j]=0; } } for(i=0;i<m;i++) { for(int j=0;j<m;j++) { for(int k=0;k<n;k++) { u[i][j]=u[i][j]+pow(x[k],j+i); } } } for(i=0;i<m;i++) { for(int k=0;k<n;k++) { u[i][m]=u[i][m]+pow(x[k],i)*y[k]; } } } void dxs::show() { for(int i=0;i<m;i++) { for(int j=0;j<m+1;j++) { cout<<u[i][j]<<" ";//<<endl; } cout<<endl; } ////显示具有m行m+1列u数组的各元素值 } void dxs::select_main(int k,float **p,int m) { double d; d=*(*(p+k)+k); //cout<<d; int l=k; int i=k+1; for(;i fabs(d)) { d=*(*(p+i)+k); l=i; } else continue; } if(d==0) cout<<"错误"; else { if(k!=l) { for(int j=k;j<m+1;j++) { double t; t=*(*(p+l)+j); *(*(p+l)+j)=*(*(p+k)+j); *(*(p+k)+j)=t; } } } } void dxs::gaosi() { for(int k=0;k<m;k++) { select_main(k,u,m);//调用列主元函数 for(int i=1+k;i<m;i++) { // *(*(p+i)+k)=(float) *(*(p+i)+k) / *(*(p+k)+k); u[i][k]=(float) u[i][k] / u[k][k]; } for(i=k+1;i<m;i++) { for(int j=k+1;j=0;i--) { float a=0; for(int j=i+1;j<m;j++) { //a=a + (*(*(p+i)+j) * *(*(p+j)+m)); a=a+u[i][j] * u[j][m]; } //*(*(p+i)+n-1)= (*(*(p+i)+n-1) - a) / *(*(p+i)+i); u[i][m]= (u[i][m] -a) / u[i][i]; } cout<<"方程组的解为:"<<endl; for(i=0;i<m;i++) { cout<<"a"<<i+1<<"="; cout<<u[i][m]<<endl; // l[i]=*(*(p+i)+n-1); } cout<<"y="<<u[0][m]; for(i=1;i<m;i++) { cout<<showpos<<u[i][m]<<"x"; if(i!=1)cout<<"^"<<noshowpos<<i; } cout<<endl; } dxs::~dxs() { delete[]x,y; delete []*u; } #endif
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值