从零开始的数模学习（8）：拟合方法（预测模型）

Day-3

已于 2023-02-21 14:06:42 修改

阅读量988

点赞数

分类专栏：从零开始的数模学习文章标签：线性最小二乘法曲线拟合 Matlab 多项式拟合优化函数

于 2022-03-10 22:37:11 首次发布

本文链接：https://blog.csdn.net/weixin_61823031/article/details/123407805

版权

从零开始的数模学习专栏收录该内容

18 篇文章 13 订阅

订阅专栏

1 曲线拟合的线性最小二乘法

1.1 线性最小二乘法

曲线拟合问题的提法是，已知一组（二维）数据，即平面上的 $n$ 个点 $(x_{i},y_{i}),i = 1,2,\cdots,n$ ，x_{i}互不相同，寻求一个函数（曲线） $y = f (x)$ ，使 $f (x)$ ，在某种准则下与所有的数据点最为接近，即曲线拟合得最好。
线性最小二乘法是解决曲线拟合最常用的方法，基本思路是，令 $a_{i}r_{1}(x)+a_{2}r_{2}(x)+\cdots+a_{m}r_{m}(x)$ ，其中 $r_{k}(x)$ 是实现选定的一组线性无关的函数， $a_{k}$ 是待定系数 $(k=1,2,\cdots,m,m<n)$ 。拟合准则是使 $y_{i}，i=1,2,\cdots,n$ 与 $f(x_{i})$ 的距离 $\delta _{i}$ 的平方和最小，称为最小二乘准则。

1.1.1 系数 $a_{k}$ 的确定

记 $J\left(a_{1}, \cdots, a_{m}\right)=\sum_{i=1}^{n} \delta_{i}^{2}=\sum_{i=1}^{n}\left[f\left(x_{i}\right)-y_{i}\right]^{2}$ 为求 $a_{1}, \cdots, a_{m}$ 使得 $J$ 达到最小，只需要利用极值的必要条件 $\frac{\partial \boldsymbol{J}}{\partial \boldsymbol{a}_{j}}=\mathbf{0}(\boldsymbol{j}=\mathbf{1}, \cdots, \boldsymbol{m})$ ，得到关于 $a_{1}, \cdots, a_{m}$ 的线性方程式 $\sum_{i=1}^{n} r_{j}\left(x_{i}\right)\left[\sum_{k=1}^{m} a_{k} r_{k}\left(x_{i}\right)-y_{i}\right]=0, \quad(j=1, \cdots, m),$
记 $\begin{aligned} R &=\left[\begin{array}{ccc} r_{1}\left(x_{1}\right) & \cdots & r_{m}\left(x_{1}\right) \\ \vdots & \vdots & \vdots \\ r_{1}\left(x_{n}\right) & \cdots & r_{m}\left(x_{n}\right) \end{array}\right]_{n \times m}, \\ A &=\left[a_{1}, \cdots, a_{m}\right]^{T}, \quad Y=\left[y_{1}, \cdots, y_{n}\right]^{T}, \end{aligned}$
上面的方程组可以表示为 $\boldsymbol{R}^{T} \boldsymbol{R} \boldsymbol{A}=\boldsymbol{R}^{T} \boldsymbol{Y}$
当 $\left\{r_{1}(x), \cdots, r_{m}(x)\right\}$ 线性无关时，R列满秩， $R^{T} R$ 可逆，于是上面的方程组有唯一解 $A=\left(R^{T} R\right)^{-1} R^{T} Y$

1.1.2 函数 $r_{k}(x)$ 的选取

面对一组数据 $(x_{i},y_{i}),i=1,2,\cdots,n$ ，用线性最小二乘法做曲线拟合时，首要的也是关键的一步是恰当地选取 $r_{1}(x), \cdots, r_{m}(x)$ 。如果通过机理分析，能够知道 $y$ 与 $x$ 之间应该有什么样的函数关系，则 $r_{1}(x), \cdots, r_{m}(x)$ 容易确定。若无法知道 $y$ 和 $x$ 之间的关系，通常可以将数据 $\left(x_{i}, y_{i}\right), i=1,2, \cdots, n$ 作图，直观地判断应该用什么样的曲线去作拟合。
人们常用的曲线有
(1) 直线 $y=a_{1} x+a_{2} ;$
(2) 多项式 $y=a_{1} x^{m}+\cdots+a_{m} x+a_{m+1} (一般 m=2,3 , 不宜太高）;$
(3) 双曲线 (一支) $y=\frac{a_{1}}{x}+a_{2} ;$
(4) 指数曲线 $y=a_{1} e^{a_{2} x}$ 。
对于指数曲线，拟合前需做变量代换，化为对 $a_{1}$ ， $a_{2}$ 的线性函数。
已知一组数据，用什么样的曲线拟合最好，可以在直观判断的基础上，选几种曲线分别拟合，然后比较，看哪一条曲线的最小二乘指标 $J$ 最小。

2 最小二乘法的Matlab实现

2.1 解方程组方法

在上面的记号下， $J\left(a_{1}, \cdots, a_{m}\right)=\|R A-Y\|^{2}$
Matlab中线性最小二乘的标准型为 $\operatorname{Min}_{A}\|R A-Y\|_{2}^{2}$
命令为 $\ Y A=R \backslash Y$

2.2 多项式拟合方法

如果取 $\left\{r_{1}(x), \cdots, r_{m+1}(x)\right\}=\left\{1, x, \cdots, x^{m}\right\}$ ，即用 $m$ 次多项式拟合给定数据，Matlab中有现成的函数 $a=\text { polyfit }(x 0, y 0, m)$ 其中输入参数 $x 0, y 0$ 为要拟合的数据， $m$ 为拟合多项式的次数，输出参数 $a$ 为拟合多项式 $x^{m}+\ldots+a(m) x+a(m+1)$ 的系数向量 $\ldots, a(m), a(m+1)]$ 。
多项式在 $x$ 处的值 $y$ 可用下面的函数计算 $y=\text { polyval }(a, x)_{\text {o }}$

2.3 最小二乘优化

在无约束最优化问题中，有些重要的特殊情形，比如目标函数有若干个函数的平方和构成。这一类函数一般可以写成 $F(x)=\sum_{i=1}^{m} f_{i}^{2}(x), x \in R^{n}$
其中 $x=\left[x_{1}, \cdots, x_{n}\right]^{T}$ ，一般假设 $m\ge n$ 。把极小化这类函数的问题 $\min F(x)=\sum_{i=1}^{m} f_{i}^{2}(x)$
称为最小二乘化问题。
最小二乘化是一类比较特殊的优化问题，在处理这类问题时，Matlab也提供了一些强大的函数。在Matlab优化工具箱中，由于求解最小二乘化优化问题的函数有lsqlin、lsqcurvefit、lsqnonlin、lsqnonneg，下面介绍这些函数的用法。

2.3.1 lsqcurvefit函数

给定输入输出数列xdata，ydata，求参量x，使得 $\min _{x}\|F(x, x d a t a)-y d a t a\|_{2}^{2}=\sum_{i}\left(F\left(x, x d a t a_{i}\right)-y d a a_{i}\right)^{2}$
Matlab中的函数为 $x=\text { lsqcurvefit(fun, } x 0, x d a t a, y d a t a, l b, u b, o p t i o n s)$
其中 $f u n$ 是定义函数 $F (x, x d a t a)$ 的M文件。

2.3.2 lsqnonlin 函数

已知函数向量 $F(x)=\left [ f_{1} ,\cdots,f_{k}\right ]^{T}$ ，求x使得 $min\left \| F(x) \right \|_{2}^{2}$
Matlab中的函数为 $x = l s q n o n l in (f u n, x 0, l b, u b, o pt i o n s)$
其中 $f u n$ 是定义向量函数 $F (x)$ 的 $M$ 文件。

2.3.3 lsqnonneg 函数

求解非负的 $x$ ，使得满足 $min\left\| Cx-d \right\|_{2}^{2}$ ,Matlab中此函数的基本调用格式为 $x = l s q n o nn e g (C, d)$ 。

Day-3

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
从零开始的数模学习（8）：拟合方法（预测模型）

1 曲线拟合的线性最小二乘法1.1 线性最小二乘法曲线拟合问题的提法是，已知一组（二维）数据，即平面上的nnn个点(xi,yi),i=1,2,⋯ ,n(x_{i},y_{i}),i = 1,2,\cdots,n(xi,yi),i=1,2,⋯,n，x_{i}互不相同，寻求一个函数（曲线）y=f(x)y=f(x)y=f(x)，使f(x)f(x)f(x)，在某种准则下与所有的数据点最为接近，即曲线拟合得最好。线性最小二乘法是解决曲线拟合最常用的方法，基本思路是，令 f(x)=air1(x)+a2r2(x
复制链接

扫一扫