非线性最小二乘问题的求解方法（一）

最新推荐文章于 2024-06-01 14:04:00 发布

长风万里送秋雁

最新推荐文章于 2024-06-01 14:04:00 发布

阅读量2k

点赞数 1

分类专栏：算法学习文章标签：算法线性代数

原文链接：https://core.ac.uk/display/24685704

版权

非线性最小二乘问题的求解方法（一）

1.非线性最小二乘问题
2.下降方法
附录
- Cholesky's method

本文仅仅根据《Methods For Non-Linear Least Squares Problems》文章做了整理，主要讨论求解函数极小值的各种方法，文章中多次引用了Frandsen于2004出版的书籍，有兴趣的读者可以查阅。本文借鉴了知乎文章https://zhuanlan.zhihu.com/p/93344177，并根据自己的理解做了部分补充和摘要，以备需要时查阅笔记，也欢迎网友们批评指正。

1.非线性最小二乘问题

最小二乘问题（Non-linear least squares problems）可以归结为以下的数学形式：

1.1 最小二乘问题
求解使得F(x)取得极小值的x
F(x)= $\frac {1}{2}\sum_{i=1}^{m}{f_i(x)^{2}}$
其中： $f_i$ : $R^n$ $\rightarrow$ R, i=1,2,⋯,m是给定的函数，并且m>=n

例1.1 最小二乘问题的典型来源之一就是数据拟合。如下图所示，考虑用曲线对图中的点进行拟合：

假设对点( $t_i$ , $y_i$ )进行拟合的曲线M的形式为:
$M(x,t)=x_3e^{x_1t}+x_4e^{x_2t}$
这个拟合模型的依赖参数为x= $x_1,x_2,x_3,x_4]^T$ 。我们假设存在 $x^*$ 使得下式成立：
$y_i=M(x^*,t_i)+\epsilon_i$
其中 $\epsilon_i$ 为数据源的（测量）误差，类似于白噪音。对于任意的x，存在残差：
$f_i(x)=y_i-M(x,t_i)=y_i-x_3e^{x_1t_i}-x_4e^{x_2t_i},i=1,2,⋯,m$
最小二乘拟合方法需要求解使得残差的平方和最小的参数x取值。

最小二乘问题可以认为是求解这个问题的变体：存在函数F: $R^n$ $\rightarrow$ R,求解使得该函数取得最小值（通常是目标函数（object function)或代价函数(cost function)）的参数。

1.2 全局最小值
给定F(x): $R^n$ $\rightarrow$ R,求解 $x^*=argmin_x$ {F(x)}

事实上这个问题的求解非常困难，这里只讨论简化后的问题，求解F的局部最小值，这里定义列向量x和无穷小量 $\delta$ ，求解局部最小值的问题定义如下：

1.3 局部最小值
给定F(x): $R^n$ $\rightarrow$ R,求解 $x^*$ 使得
$F(x^*)<=F(x), 其中||x-x^*||<\delta$

我们假设函数F是连续可微函数，那么根据泰勒展开式有：
$F(x+h)=F(x)+h^Tg+\frac {1}{2}h^THh+O(||h||^3)$
其中： $g\equiv F'(x)=[\frac{\partial F(x)}{\partial x_1},\frac{\partial F(x)}{\partial x_2},⋯,\frac{\partial F(x)}{\partial x_n}]^T$
$H\equiv F''(x)=[\frac{\partial ^2F(x)}{\partial x_i\partial x_j}]$
如无特殊说明，||h||为二范数， $||h||=\sqrt {h_1^2+h_2^2+⋯+h_n}$
如果 $x^*$ 是局部极小点，那么对于任意列向量h均无法使得 $F(x^*+h)$ 取得更小值（相较于 $F (x)$ )，综合连续可微的条件，可得 $x^*$ 为函数的局部极小点的必要条件： $g^*\equiv F'(x)=0$ .满足该条件的 $x^*$ 称为驻点。
函数的驻点并不一定是函数的局部极小点或局部最大点，不满足局部最大点或局部最小点的驻点称为鞍点，对于驻点 $x_s$ ，有：
$F(x_s+h)=F(x_s)+\frac {1}{2}h^TH_sh+O(||h||^3)$ , $H = F^{''} (x)$
如果 $H_s$ 为正定矩阵，则 $x_s$ 为局部最小值；如果 $H_s$ 为负定矩阵，则 $x_s$ 为局部最大值；否则， $x_s$ 为鞍点。

2.下降方法

非线性优化问题的求解思路大多相似：从初始点 $x_0$ 经过一系列的迭代： $x_1, x_2, ⋯$ 最终（可能）收敛于 $x^*$ ，即函数的极小点。需要注意的是，函数可能有很多局部极小点，迭代最终得到的局部极小点与选取的初始点具有密切联系。在迭代初始阶段，我们并不能知道最终的迭代结果，因为局部极小值并不一定接近初始值。迭代的过程明显分为两个阶段：当初始值离局部极小点较远时，除了最初的几步迭代，我们期待迭代过程中误差逐渐减小（原文中这里是不增大）： $e_{k+1}<e_k||, k>K.$ 其中 $e_k=x_k-x^*$ ；当迭代值 $x_k$ 距离 $x^*$ 较近时，即最后阶段，我们需要较快的收敛速度，如：
线性收敛， $e_{k+1}||<a||e_k||,其中||e_k||为较小值且0<a<1$

最低0.47元/天解锁文章

长风万里送秋雁

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
非线性最小二乘问题的求解方法（一）

非线性最小二乘问题的求解方法1.非线性最小二乘问题1.非线性最小二乘问题最小二乘问题（Non-linear least squares problems）可以归结为以下的数学形式：1.1 最小二乘问题求解使得F(x)取得极小值的xF(x)=12∑i=1mfi(x)2\frac {1}{2}\sum_{i=1}^{m}{f_i(x)^{2}}21∑i=1mfi(x)2其中：fif_ifi:RnR^nRn→\rightarrow→R, i=1,2,⋯,m是给定的函数，并且m>=n
复制链接

扫一扫