目录
1.简介
与插值算法不同,拟合算法不需要曲线一定经过给定的点。拟合算法的目标是寻求一个函数(曲线),使得该曲线在某种准则下与所有的数据点最为接近,即曲线拟合的最好(最小化损失函数)。
虽然插值算法的Roung现象可以通过分段来缓解,但是通常我们更加倾向于找的一条确定曲线,尽可能减小误差同时不需要每次都重新确定。
2.模型
(1)本质
拟合出一个函数,使得误差最小,最常见的准则是最小二乘法(Least Square Method):
这里以拟合函数为为例:
取样本点,令拟合值为,拟合目标为:
其中,损失函数(残差平方和)L:
对于多元函数求最小值,求偏导:
理论值如下:
(2)评价
对于拟合的优劣衡量大致有以下几个标准:
- 总体平方和(Total Sum of Square,SST):
- 误差平方和(Sum of Error Square,SSE):
- 回归平方和(Sum of Regression Square,SSR):
有一个重要的关系:
拟合优度:
越接近1,说明误差平方和越接近0,误差越小。
注:仅用于线性函数的拟合结果评价,其他函数(复杂的指数函数等)拟合度优劣直接看SSE,可能为负。这里的线性是针对拟合的参数,而非原函数的自变量。
参考下文[1]:
如何判断线性于参数?
在函数中,参数仅以一次方出现,且不能乘以或除以其他任何的参数,并不 能出现参数的复合函数形式
以上均属于线性于参数,而均不是。
3.代码
Matlab中有 cftool 工具箱:
4.REFERENCE
[1]. 古扎拉蒂《计量经济学基础》第五版