非线性回归——非线性函数最小二乘拟合

最新推荐文章于 2025-03-26 11:26:25 发布

一只特立独行的蚂蚁

最新推荐文章于 2025-03-26 11:26:25 发布

阅读量1.4w

点赞数 8

分类专栏：数值分析算法文章标签：算法

本文链接：https://blog.csdn.net/luolei188/article/details/105610723

版权

数值分析算法专栏收录该内容

10 篇文章

订阅专栏

非线性回归——非线性函数的最小二乘拟合

非线性回归

非线性回归

1.1 可转为线性回归

上一篇文章曲线拟合——最小二乘拟合中已近详细介绍了线性回归的方法。
并且提到了，对于非线性模型中，有3种类型可以线性化：指数方程，幂方程，饱和增长率方程。分别如下：
1.指数方程: $y = a_1e^{a_2x}$
2.幂方程: $y = a_1x^{a_2}$
2.饱和增长率方程: $a_1\frac{x}{x+a_2}$

可将其转化为线性形式然后处理。具体方法这里不再细讲，接下来还是主要讲不能线性化的模型的处理方法。

1.2 非线性回归

对于不能线性化的模型，我们又该如何处理呢？

以下式为例：
$y = a_0(1-e^{-a_1x})$

如果给定一组数据 $x_1,y_1),(x_2,y_2),(x_3,y_3),...,(x_n,y_n)$ ，要拟合上述曲线的形式，我们依然采用残差平方和最小原则，残差平方和计算如下：
$S_r = \sum_{i=1}^{n} {[y_i- a_0(1-e^{-a_1x_i})]^2}$

接下来就要注意了，如果我们依然和之前线性回归中一样，将上式 $S_r$ 分别对系数 $a_0$ 和 $a_1$ 求偏导，然后令其为0，那么得到的方程组将是复杂的非线性方程组，使得求解 $a_0$ 和 $a_1$ 的值十分困难。

因此，我们需要寻求其他的处理办法。
接下来介绍两个思路：
1.高斯一牛顿法（迭代）法。
2.最优化的方法；

1.2.1 高斯一牛顿法

上面遇到的一大问题就是要解非线性方程组。那我们能不能想办法避免解非线性方程组呢？
于是就有了如下的高斯一牛顿迭代的方法。
首先，对于非线性函数模型，如 $y = a_0(1-e^{-a_1x})$ ，将非线性方程和数据之间的关系表示为一般形式（如果对下面的表示和处理方法不理解的话，可与“曲线拟合——最小二乘拟合”中“线性回归小结”中所讲的联系起来思考）:
$y = f(x_i;a_1,a_2,...,a_m)$
或
$y = f(x_i)$

在参数值处，将上面的非线性模型围绕参数值以泰勒级数展开，并省略一阶导数后面的项。于是，对于有两个参数的情况有
在这里插入图片描述
其中，下标为j的是初始参数值（上一次迭代的参数值），下标为j+1的是预测值。 $\triangle{a_0}=a_{0,j+1}-a_{0,j}$ ， $\triangle{a_1}=a_{1,j+1}-a_{1,j}$ 。
于是，就将原非线性模型关于参数进行了线性化。然后将上式代入到 $y = f(x_i)$ 中，就得到：
在这里插入图片描述
以矩阵形式表示为：

将线性最小二乘理论应用于式此，得到下面的正规方程：

通过求解该线性方程组可得到 $\triangle{A}$ 。然后可以用 $\triangle{A}$ 来计算改进后的参数值:

和

由于泰勒展开并不是精确表示，所以得到的 $a_0$ 和 $a_1$ 并不准确，需要通过重复上面的过程，不断地迭代提高精度，直到求解过程收敛为止，收敛条件：
在这里插入图片描述
小于一个可以接受的终止条件，结束。

同时，需要注意：
在这里插入图片描述

1.2.2 转为最优化问题处理

我们跳出上面说的，求偏导然后求解 $a_0$ 和 $a_1$ 的思路。直接想办法，使残差平方和 $S_r$ 最小。这样，只要能使残差平方和 $S_r$ 最小，就能满足残差平方和最小原则，得到的就是我们想要的拟合结果。

这里，我们就可以直接利用最优化的方法，将 $S_r = \sum_{i=1}^{n} {[y_i- a_0(1-e^{-a_1x_i})]^2}$ 作为目标函数，将其中的 $a_0$ 和 $a_1$ 看作是变量，想办法要使 $S_r$ 最小，而使 $S_r$ 最小时的 $a_0$ 和 $a_1$ 的值，就是我们所寻找的结果。