拟合算法
描述:
与插值问题不同,在拟合问题中不需要曲线一定经过所有给定的点,这也是拟合和插值算法不同的地方,拟合算法的目标是查找一个简单的函数(曲线),是的该曲线在某种准则先于给定的所有数据点尽可能的接近,即曲线拟合的最好(最小化损失函数)。
(算法主要用于预测)
插值算法和拟合算法的区别
插值算法中,得到的插值函数f(x)要经过所有样本点。但是如果样本点太多,那 么这个多项式次数过高,会造成龙格现象。 尽管我们可以选择分段的方法避免这种现象,但是更多时候我们更倾向于得到 一个确定的曲线,尽管这条曲线不能经过每一个样本点,但只要保证误差在某种准则上足够小即可,这就是拟合的思想。(拟合的结果是得到一个确定的曲线)
1、最小二乘法的定义和解释
拟合算法的作用就是使样本点和拟合曲线尽可能的接近,那假设样本点为(Xi,Yi),i = 1,2,3…n,设置拟合曲线为y = kx +b,那么最小二乘法的作用就是计算当k和b取何值时,样本点和拟合曲线最接近。
这里涉及到一个讨论:要计算当样本点和拟合曲线最接近时的k和b值,那这k和b的公式该如何定义何计算?