1.线性最小二乘法
曲线拟合问题的提法是,已知一组(二维)数据,即平面上的
个点
,
,
互不相同,寻求一个函数(曲线)
使
在某种准则下与所有数据点最为接近,即曲线拟合得最好。
线性最小二乘法是解决曲线拟合最常用的方法,基本思路是,令:
其中
是事先选定的一组线性无关的函数,
是待定系数
。拟合准则是使
,与
的距离
的平方和最小,称为最小二乘准则。
1.1.系数
的确定
记:
为求
使
达到最小,只需利用极值的必要条件
,得到关于
的线性方程组:
即:
记:
方程组(2)可表为:
当
线性无关时,
列满秩,
可逆,于是方程组(3)有唯一解:
1.2.函数
的选取
面对一组数据
,用线性最小二乘法作曲线拟合时,首要的、也是关键的一步是恰当地选取
容易确定。若无法知道
与
之间的关系,通常可以将数据
作图,直观地判断应该用什么样的曲线去作拟合。人们常用的曲线有:
(1)直线:
(2)多项式:
(一般
,不宜太高)
(3)双曲线(一支):
(4)指数函数:
对于指数曲线,拟合前需作变量代换,化为对
的线性函数。
已知一组数据,用什么样的曲线拟合最好,可以在直观判断的基础上,选几种曲线分别拟合,然后比较,看哪条曲线的最小二乘指标
最小。
2.最小二乘法的Matlab实现
2.1.解方程组方法
在上面的记号下,
Matlab中的线性最小二乘的标准型为:
命令为:
例1 用最小二乘法求一个形如
的经验公式,使它与下表所示的数据拟合。
19
25
31
38
44
19.0
32.3
49.0
73.3
97.8
解:编写程序如下
x=[19 25 31 38 44]';
y=[19.0 32.3 49.0 73.3 97.8]';
r=[ones(5,1),x.^2];
ab=r\y%求出最小二乘的系数
x0=19:0.1:44;
y0=ab(1)+ab(2)*x0.^2;
plot(x,y,'o',x0,y0,'r')
这里没有用任何函数,笔者也是第一次知道反斜杠可以直接算出最小二乘算法的系数。
2.2.多项式拟合方法
如果取
,即用
次多项式拟合给定数据,Matlab中有现成的函数:
a=polyfit(x0,y0,m)
其中输入参数
为要拟合的数据,
为拟合多项式的次数,输出参数
为拟合多项式
的系数
例2 某乡镇企业 1990-1996 年的生产利润如下表
年份
1990
1991
1992
1993
1994
1995
1996
利润(万元)
70
122
144
152
174
196
202
试预测1997年和1998年的利润:
解:做已知数据的散点图:
x0=[1990 1991 1992 1993 1994 1995 1996];
y0=[70 122 144 152 174 196 202];
plot(x0,y0,'*')
发现该乡镇企业的年生产利润几乎直线上升。因此,我们可以用
作为拟合函数来预测该乡镇企业未来的年利润。编写程序如下:
x0=[1990 1991 1992 1993 1994 1995 1996];
y0=[70 122 144 152 174 196 202];
a=polyfit(x0,y0,1)
y97=polyval(a,1997)
y98=polyval(a,1998)
求得
,预测1997年的利润为233.4286万元,1998年的生产利润是253.9286元。