拟合算法的适用情况
当数据样本点非常多时,使用高次多项式插值会产生严重的龙格现象,而使用低次分段插值得到的函数表达式又过于复杂,因此拟合算法的思想就是找出一条尽可能满足误差最小的简单曲线,而这条曲线不必经过所有的样本点。
拟合算法步骤(重点)
①确认拟合曲线的类型:曲线要满足一定的趋势同时尽可能简单。
②使用最小二乘法求出使得曲线误差最小时对应的曲线参数。该步骤可以通过Matlab中的曲线拟合工具箱进行实现,并导出所绘制的曲线图。
拟合结果的评价
为了评价拟合结果,首先需要引入总体平方和SST、误差平方和SSE和回归平方和SSR的概念,这三个量的计算公式如下:
并且这三个量满足:SST=SSE+SSR。
拟合优度:拟合优度用于评价线性拟合的结果,定义拟合优度R²=SSR/SST。拟合优度越接近1,拟合效果越好。这里用拟合优度评价拟合结果而不是SSE,是因为考虑到量纲的影响。但是对于非线性函数(不属于广义上的线性函数),不能滥用拟合优度,只能通过比较SSE来判断拟合结果的好坏。
拟合函数的复杂度控制: 拟合函数除了需要考虑到拟合的最终效果外,同样还要尽量使得拟合函数尽可能简洁。对于多项式模型,最好不要使用次数太高的多项式作为拟合函数。
线性拟合的概念
线性函数要求对参数为线性,即各个参数只以一次方的形式出现,并且不存在参数之间的复合运算。因此,一些表面上不是线性的函数可以通过形式变换得到线性函数。
拟合算法的应用场景
拟合算法可以用于数据补充,也可以用于预测。