4、不仅仅应用于标定的非线性优化问题

宛如新生

已于 2022-08-14 16:31:00 修改

阅读量403

点赞数 2

分类专栏： slam中的标定问题文章标签：机器学习人工智能算法

于 2022-07-11 22:01:14 首次发布

本文链接：https://blog.csdn.net/Walking_roll/article/details/125709044

版权

slam中的标定问题专栏收录该内容

12 篇文章 9 订阅

订阅专栏

一、非线性优化算法通用流程

非线性优化的基本流程可以总结如下(最小化问题)：
在这里插入图片描述
可以看到，我们主要的工作就是寻找那个 $\Delta x_i$ ，而不同的寻找方法和更新流程，就对应不同的优化方法。

二、不同的优化方法

在这里插入图片描述

1.梯度下降法

上图表示我们目标函数的二维表现形式。我们通过非线性优化的方法找到函数的最小值对应的 $x_1$ 和 $x_2$ 。
在这里插入图片描述
其中 $g (x)$ 是 $F (x)$ 的一阶导。 $\alpha$ 为我们设定的步长。为了达到使得目标函数值随自变量变化而减少的要求，得出下降方向 $h$ 。
也就是说，我们在 $x$ 点给定一个步长 $\alpha$ 和一个与一阶导方向夹角大于90°的一个方向 $h$ ,则可以保证目标函数值是向减少的方向更新自变量参数的。

2.最速下降法

最速下降法也很简单，顾名思义就是找到使得目标函数变化率最大的那个方向即可。
在这里插入图片描述
即，当函数梯度和下降方向夹角为 $\pi$ 时，迭代更新最快可以达到最小值。

他是有明显缺点的。由于这里面我们要给定他一个非负步长 $\alpha$ ,从上图来看，步长给大了，对后面迭代过程是不友好的，很容易陷入反复，陷入一个死循环。步长给小了效率太低，所以这个 $\alpha$ 很难去合理确定。

3.牛顿法

牛顿法是对最速下降法的一个改进。
在这里插入图片描述
我们通过上面的方法就能直接解出 $h$ ，但这也是有条件的，那就是 $H$ 必须正定，但在实际的工程问题中这很难一直保证。
一般情况下，牛顿法中 $\alpha=1$ 。

牛顿法之所以比最速下降法要好就是因为，牛顿法用了泰勒公式进行了二阶近似。求解出来的 $h$ 受二阶导的影响，接近最小值附近时，$h
$会变得更小来适应最后阶段的迭代。
缺点也很明显，他要计算二阶海森矩阵，这是非常复杂的，加大了计算量。

4.高斯-牛顿法

高斯牛顿法又是对牛顿法的改进。
在这里插入图片描述
与牛顿法对比，发现高斯牛顿法不是对目标函数进行展开，而是对里面的误差函数 $f (x)$ 进行一阶泰勒展开。代入目标函数，发现得到 $J^TJh = -J^Tf(x)$ ,与牛顿法的正规方程形式一致，相当于高斯牛顿法用 $J^TJ$ 近似了牛顿法中很难计算的 $H$ 。这大大降低了牛顿法的计算量。