曲线拟合的最小二乘原理

最新推荐文章于 2025-02-23 19:56:56 发布

孙悟空

最新推荐文章于 2025-02-23 19:56:56 发布

阅读量7.6k

点赞数 4

分类专栏：数学基础

本文链接：https://blog.csdn.net/weixin_46098577/article/details/118342770

版权

数学基础同时被 2 个专栏收录

12 篇文章

订阅专栏

最小二乘

1 篇文章

订阅专栏

文章目录

1 什么是最小二乘

在科学实验的统计方法研究中，往往要从一组实验数据 $x_i,y_i)(i=0,1,2,…,m)$ 中寻找自变量 $x$ 与因变量 $y$ 之间的函数关系 $y = F (x)$ . 由于观测数据往往不准确，因此不要求 $y = F (x)$ 经过所有点 $x_i,y_i)$ ，而只要求在给定点 $x_i$ 上误差 $δ_i=F(x_i )-y_i (i=0,1,2,…,m)$ 按某种标准最小。若记 $δ=(δ_0,δ_1,…,δ_m)^T$ ，就是要求向量 $δ$ 的范数最小，通常采用计算较为简单的欧式范数 $δ‖_2$ 作为误差衡量的标准。

关于最小二乘的一般提法是：对给定的一组数据 $x_i,y_i)(i=0,1,2,…,m)$ ，要求在函数类 $φ\{φ_0,φ_1,…,φ_n\}$ 中找到一个函数 $y=S^* (x)$ ，使误差平方和最小，即
$\Vert δ \Vert_2^2=∑_{i=0}^m{δ_i^2}=∑_{i=0}^m[S^* (x_i )-y_i ]^2=min_{S(x)∈φ}⁡∑_{i=0}^m[S(x_i )-y_i ]^2----(Formula.1)$

其中，
$S(x)=a_0 φ_0 (x)+a_1 φ_1 (x)+⋯+a_1 φ_1 (x) ,(n<m)----(Formula.2)$

这就是一般的最小二乘逼近，用几何语言说，就称为曲线拟合的最小二乘法。

2 最小二乘原理

用最小二乘法求拟合曲线时，首先要确定 $S (x)$ 的形式。这不单纯是数学问题，还与所研究问题的运动规律及所得观测数据 $x_i,y_i)$ 有关；通常要从问题的运动规律及给定数据描图，确定 $S (x)$ 的形式，并通过实际计算选出较好的结果。 $S (x)$ 的一般表达式为 $F o r m u l a . 2$ 式表示的线性形式。为了使问题的提法更有一般性，通常把最小二乘法中 $\Vert δ \Vert_2^2$ 都考虑为加权平方和
$\Vert δ \Vert_2^2=\sum_{i=0}^m\omega(x_i)\left[S(x_i)-f(x_i)\right]^2----(Formula.3)$
这里， $ω (x) \geq 0$ 是 $[a, b]$ 上的权函数，它表示不同点 $x_i,f(x_i))$ 处的数据比重不同，通常表示在点 $x_i,f(x_i))$ 处重复观测的次数。用最小二乘法求拟合曲线的问题，就是在形如 $(F o r m u l a . 2)$ 式的 $S (x)$ 中求一函数 $y=S^* (x)$ ，使 $F o r m u l a . 3$ 式取得最小。可以将这个问题转化为求多元函数
$I(a_0,a_1,…,a_n )=∑_{i=0}^mω(x_i)\left[∑_{j=0}^na_j φ_j (x_i )-f(x_i)\right]^2-----(Formula.4)$
的极小值点 $a_0^*,a_1^*,…,a_n^*)$ 的问题。

由求多元函数极值的必要条件，有
$\cfrac{∂I}{∂a_k}=2∑_{i=0}^mω(x_i )\left[∑_{j=0}^na_jφ_j(x_i)-f(x_i)\right] φ_k (x_i )=0,(k=0,1,…,n)----(Formula.5)$
若记
$φ_j,φ_k )= ∑_{i=0}^mω(x_i ) φ_j (x_i ) φ_k (x_i )----(Formula.6)$
$f,φ_k )=∑_{i=0}^mω(x_i ) f(x_i ) φ_k (x_i )≡d_k,(k=0,1,…,n)----(Formula.7)$
则 $F o r m u l a . 4$ 可改写为
$_{j=0}^n(φ_k,φ_j)a_j=d_k,(k=0,1,…,n)----(Formula.8)$
$F o r m u l a . 8$ 式称为法方程，矩阵形式为
$G a = d - - - - (F o r m u l a . 9)$
其中， $a=(a_0,a_1,...,a_n)^T$ ， $d=(d_0,d_1,...,d_n)^T$
$G=\begin{bmatrix} {(φ_0,φ_0)}&{(φ_0,φ_1)}&{\cdots}&{(φ_0,φ_n)}\\ {(φ_1,φ_0)}&{(φ_1,φ_1)}&{\cdots}&{(φ_1,φ_n)}\\ {\vdots}&{\vdots}&{\ddots}&{\vdots}\\ {(φ_n,φ_0)}&{(φ_n,φ_1)}&{\cdots}&{(φ_n,φ_n)}\\ \end{bmatrix}$
由于 $φ_0,φ_1,...,φ_n$ 线性无关，因此 $∣ G ∣ \neq = 0$ ，方程组 $F o r m u l a . 8$ 存在唯一解
$a_k=a_k^*，（k=0,1,...,n）----(Formula.10)$
从而得到函数 $f (x)$ 的最小二乘解为
$S^*(x)=a_0^*φ_0(x)+a_1^*φ_1(x)+...+a_n^*φ_n(x)----(Formula.11)$
可以证明 $S^*(x)$ 对于任何形如 $F o r m u l a . 2$ 式的 $S (x)$ ，都有
$_{i=0}^mω(x_i ) [S^* (x_i )-f(x_i )]^2≤∑_{i=0}^mω(x_i ) [S(x_i)-f(x_i )]^2 ----(Formula.12)$

也就是说，只要对一组数据的法方程进行求解，就可以得到唯一一组多项式的系数解。如何求解方程组，将会在后续的博客中给出。

3 最小二乘应用示例

下面通过一个例题进一步理解曲线的最小二乘

在这里插入图片描述

4 法方程到底是什么

相信不少人对于法方程 $G a = d$ 中 $G$ 的元素到底是什么存在疑问，那么 $G$ 中的 $φ$ 到底是什么呢？下面通过分析一阶、二阶、三阶多项式拟合的法方程，帮助大家理解这个问题。

回顾一下 $G$
$G=\begin{bmatrix} {(φ_0,φ_0)}&{(φ_0,φ_1)}&{\cdots}&{(φ_0,φ_n)}\\ {(φ_1,φ_0)}&{(φ_1,φ_1)}&{\cdots}&{(φ_1,φ_n)}\\ {\vdots}&{\vdots}&{\ddots}&{\vdots}\\ {(φ_n,φ_0)}&{(φ_n,φ_1)}&{\cdots}&{(φ_n,φ_n)}\\ \end{bmatrix}$

需要明确的一点是：若以 $x$ 为自变量，则 $φ_0 (x)=x^0=1，φ_1 (x)=x^1，φ_2 (x)=x^2，… ，φ_n (x)=x^n$ .

已知一组数据点 $P=\{p_1 (x_1,y_1 ),p_2 (x_2,y_2 ),…,p_m (x_m,y_m )\}$ ，每个点只观测一次，即 $\omega(x)≡1$ . 分别对其进行一阶、二阶、三阶多项式拟合，对应的拟合函数与法方程如下：

拟合阶数	拟合函数	法方程
1	$S(x)=a_0+a_1 x$	$\begin{bmatrix}\sum_{i=1}^mx_i^0&\sum_{i=1}^mx_i^1&\\\sum_{i=1}^mx_i^1&\sum_{i=1}^mx_i^2&\\\end{bmatrix}$ $\begin{bmatrix}a_0\\a_1\\\end{bmatrix}$ = $\begin{bmatrix}\sum_{i=1}^mx_i^0y_i^1\\\sum_{i=1}^mx_i^1y_i^1\\\end{bmatrix}$ (详细)
1	$S(x)=a_0+a_1 x$	$\begin{bmatrix}m&\sum x\\\sum x&\sum x^2\\\end{bmatrix}$ $\begin{bmatrix}a_0\\a_1\\\end{bmatrix}$ = $\begin{bmatrix}\sum y\\\sum xy\\\end{bmatrix}$
2	$S(x)=a_0+a_1 x+a_2 x^2$	$\begin{bmatrix}m&\sum x&\sum x^2 \\\sum x&\sum x^2&\sum x^3\\\sum x^2&\sum x^3&\sum x^4\\\end{bmatrix}$ $\begin{bmatrix}a_0\\a_1\\a_2\\\end{bmatrix}$ = $\begin{bmatrix}\sum y\\\sum xy\\\sum x^2y\\\end{bmatrix}$
3	$S(x)=a_0+a_1 x+a_2 x^2+a_3 x^3$	$\begin{bmatrix}m&\sum x&\sum x^2&\sum x^3 \\\sum x&\sum x^2&\sum x^3&\sum x^4\\\sum x^2&\sum x^3&\sum x^4&\sum x^5\\\sum x^3&\sum x^4&\sum x^5&\sum x^6\\\end{bmatrix}$ $\begin{bmatrix}a_0\\a_1\\a_2\\a_3\\\end{bmatrix}$ = $\begin{bmatrix}\sum y\\\sum xy\\\sum x^2y\\\sum x^3y\\\end{bmatrix}$
…	…	…