前言
拟合算法在数学建模中起着举足轻重的作用,帮助进行数据预处理,模型选择等,本文就介绍了拟合算法的基础内容。
一、拟合算法——基本概念
拟合问题的目标是寻求一个函数(曲线),使得该曲线在某种准则下与所有的数据点最为接近,即曲线拟合的最优(最小化损失函数)。
二、拟合与插值的区别
1.拟合不需要曲线经过所有给定的点,拟合的结果是得到一条确定的曲线;而插值算法得到的多项式需要经过所有的样本点,但如果样本点太多,那么多项式的次数过高,会造成龙格现象。
2、拟合的思想:尽管这条曲线不能经过每一个样本点,但只要保证误差足够小即可。(拟合的结果是得到一个确定的曲线)
3、在一般情况下,在数据样本较多时,使用拟合算法;在样本数据较少时,使用插值算法。
注:龙格现象:在计算方法中,有利用多项式对某一函数的近似逼近,计算相应的函数值。一般情况下,多项式的次数越多,需要的数据就越多,而预测也就越准确。插值次数越高,插值结果越偏离原函数的现象称为龙格现象。
三、最小二乘法的解释##
一个小例子
找出y和x之间的拟合曲线
第一步:画出散点图
**第二步:根据散点图,确定拟合曲线。**假设我们的拟合曲线为y=kx+b
问题:当k和b取何值时,样本点和拟合曲线最为接近。
那么如何去定义这个接近呢?两种定义方法如下:
y^是拟合值。我们所要求的最小,就是要求拟合值与样本点的最短距离,从而确定k和b的值。
第一种定义有绝对值,不容易求导,因此计算比较复杂。所以在实际中我们往往使用的是第二种定义,第二种定义也就是最小二乘的思想,也就是真实值和拟合值的所有的差值之和最小。
注:那么为什么不使用三次方,四次方呢?