我们有多种方案来对模型进行数据拟合,来得到模型的未知参数值,因此存在着一个问题,我们如何去挑选一个合适的模型。
我们先来考虑上一篇文章所讲的的模型
y=Ax2
的适配问题。
y=Ax2
对于这个模型,我们在上一篇就已经用 最小二乘法准则 和 变换后的最小二乘准则 来对其进行拟合,我们发现,两个拟合后的结果并不大一样。对于一个模型是否很好的拟合了数据的一个评估途径是 计算模型数据点与实际点的偏差。稍后我们将对几种方式获得的模型的绝对偏差进行对比。
现在我们先应用 切比雪夫近似准则 来对该模型进行数据拟合。
因为有5个数据点,该数学问题就是最小化五个数
|ri|=|yi−f(xi)|
中的最大者,我们将其记为
r
。我们需要极小化
|r−ri|≥0
对这一系列线性规划约束方程进行求解,将产生 r=028293 和 A=3.17073 。这里我们将最大绝对偏差降到了0.28293。注意,这是我们所能获得的最大绝对偏差的最小值。
现在确定了该模型 y=Ax2 的三个估计,那么我们要选择其中哪个呢。下表将列举三个估计的绝对偏差与实测点的 残差
xi | yi | yi−3.1869x2i | yi−3.1368x2i | yi−3.17073x2i |
---|---|---|---|---|
0.5 | 0.7 | -0.0967 | -0.0842 | -0.0927 |
1.0 | 3.4 | 0.2131 | 0.2632 | 0.2293 |
1.5 | 7.2 | 0.029475 | 0.1422 | 0.0659 |
2.0 | 12.4 | -0.3476 | -0.1472 | -0.2829 |
2.5 | 20.1 | 0.181875 | 0.4950 | 0.28293 |
接下来我们对这三个模型的偏差进行一个总结
方法 | 模型 | ∑[yi−f(xi)]2 | max|yi−f(xi)| |
---|---|---|---|
最小二乘 | yi−3.1869x2i | 0.2095 | 0.3476 |
变换后的最小二乘 | yi−3.1368x2i | 0.3633 | 0.4950 |
切比雪夫 | yi−3.17073x2i | 0.2256 | 0.28293 |
从上表中我们可以看出,每一种方法都有其优势之处。所以在我们对模型估计进行挑选的时候,我们需要去考虑模型的使用目的,实际情况所要求的精度,数据的准确性等等因素去综合考虑
车辆的停止距离
回顾车辆的停止距离的问题,我们讨论了速度和刹车距离之间的关系,得到了一个停止距离模型
d=1.1v+0.054v2
现在我们利用 最小二乘准则 来对这个模型进行拟合,可得到结果为 d=1.104v+0.0542v2 ,可以发现结果并没有显著的差异。
接下来我们要分析拟合结果,如下图所示。
我们可以发现,我们的模型在70mph之前都是大于实测速度,之后都是低估了停止距离,为此我们可以划出该模型的 残差图 以此来看到哪里这个模型哪里出现了问题,将残差作为一个独立变量的函数而得到的函数图即为残差图。如下图所示
在这里可以很明显的看出,在70mph之前的残差都是大于0的值,之后都小于0。而如果一个模型是完美的拟合了实际情况的话,这个模型的残差图所展现的偏差不仅小,而且应该有正有负,所以我们得到的这个停止距离的模型,并不是一个完美的模型,他无法对我们的现实生活中的停止距离进行拟合。