SLAM中非线性优化

最新推荐文章于 2022-05-11 17:24:40 发布

磊磊哈哈

最新推荐文章于 2022-05-11 17:24:40 发布

阅读量233

点赞数

本文链接：https://blog.csdn.net/weixin_37781153/article/details/109056948

版权

SLAM十四讲专栏收录该内容

37 篇文章 8 订阅

订阅专栏

这里是笔记，详细请查看链接
线性最小二乘
 非线性最小二乘

基础知识

<UD分解>
$P : n 阶正定的对称矩阵$
对矩阵P进行上三角-对角分解:
$U : 上三角阵$
$D : 对角阵$
$P=UDU^T \\ P=\left[\begin{matrix} P_{11}&P_{12}&...&P_{1n}\\ P_{21}&P_{22}&...&P_{2n}\\ ...&...&...&...\\ P_{n1}&P_{n2}&...&P_{nn}\\ \end{matrix}\right],U=\left[\begin{matrix} U_{11}&U_{12}&...&U_{1n}\\ U_{21}&U_{22}&...&U_{2n}\\ ...&...&...&...\\ U_{n1}&U_{n2}&...&U_{nn}\\ \end{matrix}\right](U_{ii}=1,(i=1,2,3,..,n)),D=\left[\begin{matrix} D_{11}&D_{12}&...&D_{1n}\\ D_{21}&D_{22}&...&D_{2n}\\ ...&...&...&...\\ D_{n1}&D_{n2}&...&D_{nn}\\ \end{matrix}\right]$
求解
$P_{ij}=D_{jj}U_{ij}U_{jj}+D_{j+1,j+1}U_{i,j+1}U_{j,j+1}+...+D_{nn}U_{in}U_{jn}\\ =\sum_{k=i+j}^nD_{kk}U_{ik}U_{jk}+D_{jj}U_{ij}U_{jj}(1\leq i \leq n,i\leq j \leq n)$

<QR分解>
$A_{m×n}:为列满秩矩阵（m\geq n）,rank(A_{m×n})=n$
那末必有：
$A_{m×n}=Q_{m×n}R_{n×n},Q_{m×n}^TQ_{m×n}=I_{n×n},R_{n×n}为上三角阵或下三角阵$
<Cholesky分解>
$P : n 阶正定对称矩阵$
总可以得到：
$P=\left[\begin{matrix} P_{11}&P_{12}&...&P_{1n}\\P_{21}&P_{22}&...&P_{2n}\\ ...&...&...&...\\P_{n1}&P_{n2}&...&P_{nn} \end{matrix}\right],\Delta=\left[\begin{matrix} \delta_{11}&\delta_{12}&...&\delta_{1n}\\0&\delta_{21}&...&\delta_{2n}\\ ...&...&...&...\\0&0&...&\delta_{nn} \end{matrix}\right]$
$P=\Delta \Delta^T =\left[\begin{matrix} \delta_{11}&\delta_{12}&...&\delta_{1n}\\0&\delta_{21}&...&\delta_{2n}\\ ...&...&...&...\\0&0&...&\delta_{nn} \end{matrix}\right]\left[\begin{matrix} \delta_{11}&\delta_{12}&...&\delta_{1n}\\0&\delta_{21}&...&\delta_{2n}\\ ...&...&...&...\\0&0&...&\delta_{nn} \end{matrix}\right]^T$
可以得到：
$P_{ij}=\delta_{ij}\delta_{jj}+\delta_{i,j+1}\delta_{i,j+1}+\delta_{i,j+2}\delta_{i,j+2}+...+\delta_{i,j+n}\delta_{i,j+n}=\sum_{k=j+1}^n\delta_{ik}\delta_{jk}+\delta_{ij}\delta_{jj}(1\leq i\leq n,i\leq j \leq n)$
从而得到:
$\delta_{ij}=\begin{cases} (P_{ij}-\sum_{i+j}^{n}\delta_{ik}\delta_{jk})/\delta_{jj} &i<j\\ \sqrt{P_{jj}-\sum_{k=j+1}^{n}\delta_{jk}^2}&i=j\\ 0&i>j\\ \end{cases}$
<奇异值分解>
$A : 当为 n 阶实对称矩阵, 可分解为：$
$QQ^T=I,Q为标准正交阵，Q的列坐标为特征向量$
$\Gamma:为特征值构成的对角矩阵$
$A=Q\Gamma Q^T(特征值分解EVD) \\ \Gamma=\left[\begin{matrix} \lambda_1&...&...&....\\...&\lambda_2&...&....\\...&...&....&....\\...&...&...&\lambda_n\\ \end{matrix}\right]$
$A : 当为 n 阶实矩阵，可分解为：$
$UU^T=I,U为单位正交阵，左奇异矩阵,U\in R_{m×m}$
$VV^T=I,V为单位正交阵，右奇异矩阵,V\in R_{n×n}$
$\Sigma:奇异值，除了对角元素，其他元素为0,\Sigma \in R_{m×n}$
$A=U\Sigma V^T \\ \Sigma=\left[\begin{matrix} \sigma_1&0&...&0&0\\0&\sigma_2&...&0&0\\ 0&0&...&0&0\\0&0&...&\sigma_n&0 \end{matrix}\right]_{m×n}$
求解
$AA^T=U\Sigma V^TV\Sigma^TU^T=U\Sigma\Sigma^TU^T$

线性最小二乘

方程：
$min||期望-样本||^2$
当系统方程为一次线性方程时：
$min||Ax-b||^2=(Ax-b)^T(Ax-b)=x^TA^TAx-2x^TA^Tb+b^Tb$
取最小值，也就是求导数为0的点：
$\frac{\partial||Ax-b||^2}{\partial x}=2A^TAx-2A^Tb=0 \\ A^TAx=A^Tb \\ x=(A^TA)^{-1}A^Tb$
<Cholesky分解求解：>
令 $A^TA=L^TL,\alpha=Lx,\beta=A^Tb$
$A^TAx=A^Tb\\ L^TLx=A^Tb \\ L^T \alpha=\beta \\ Lx=\alpha$
<QR分解>
$A = Q R$
$A^TAx=A^Tb\\ (Q^TR)^T(Q^TR)x=(Q^TR)^Tb \\ R^TRx=R^TQb\\ x=R^{-1}Q^Tb$
实现

非线性最小二乘

$F (X) : 目标函数$
$min_{x}F(X)=\frac{1}{2}||f(x)||_2^2$
只需找到： $\frac{dF(x)}{dx}=0$ 的最小值的点，但有时候无法得到导数，我们使用迭代方法代替求导，步骤如下：

给定某个初值 $x_0$
进行k次迭代，寻找一个 $\Delta x_k$ ,使 $||f(x_k+\Delta x_k)||_2^2$ 达到极小值
若 $\Delta x_k$ 足够小，停止迭代
$\Delta x_k$ 不够小，令 $x_{k+1}=x_k+\Delta x_k$ ,转到第2步进行迭代

如何取定增量 $\Delta x_k$

一阶梯度法
使用泰勒函数将目标函数 $F (x)$ 在 $x_k$ 一阶展开
$J(x_k)^T=F'(x):在x_k处一阶导数也称雅可比矩阵、梯度$
$F(x_k+\Delta x_k)\approx F(x_k)+F'(x)(x+\Delta x_k-x)=F(x_k)+J(x_k)^T\Delta x_k$
取 $\Delta x_k$
$\Delta x_k=-\lambda J(x_k)^T$
如何确定步长 $\lambda$ ？
基本思想就是每次试一个步长，如果用该步长走的话，看函数值会不会比当前点下降一定的程度，如果没有，就按比例减小步长，再试，直到满足条件（根据泰勒展开式我们知道步长足够小时总会满足下降条件）。所以line search实际上是计算量比较大的，不过在以前数据量不大的情况下这都不是问题。
问题：计算量大
二阶梯度法
使用泰勒函数将目标函数 $F (x)$ 在 $x_k$ 二阶展开
$H(x_k):二阶导数，海塞(Hessian)矩阵$
$F(x_k+\Delta x_k)\approx F(x_k)+F'(x_k)(x_k+\Delta x_k-x_k)+\frac{F''(x)(x_k+\Delta x_k-x_k)^2}{2}=F(x_k)+J(x_k)^T\Delta x_k+\frac{1}{2}\Delta x_k^TH(x_k)\Delta x_k$
求 $F'(x_k+\Delta x_k)$ 关于 $\Delta x$ 的一阶导数
$F'(x_k+\Delta x_k)=J(x_0)^T+\frac{1}{2}(H\Delta x+H^T \Delta x)=J(x_0)^T+H\Delta x=0$
$\Delta x=-J$
问题：计算量大
最速下降法
什么时候不用欧氏距离
$\Delta_{nsd}:表示下降梯度$
$∣ ∣ v ∣ ∣ : 范数, 当 ∣ ∣ v ∣ ∣ 是欧氏范数时，与最一阶梯度下降法等价$
$\Delta_{nsd}=argmin(J(x_k)^Tv(| |v||<1))$
牛顿高斯法
将原函数在x处，进行一阶泰勒展开
$f(x+\Delta x)\approx f(x_k)+f'(x_k)(x_k+\Delta x_k-x_k)=f(x)+J(x)^T \Delta x$
重新构造目标函数:
$F(x)=\Delta x^*=argmin_{\Delta}\frac{1}{2}||f(x)+J(x)^T\Delta x||^2$
求极值点 $F^{'} (x) = 0$
$J(x)f(x)+J(x)J^T(x)\Delta x=0$
得到高斯牛顿方程
$H(x)=J(x)J^T(x)$
$g (x) = - J (x) f (x)$
$H(x)\Delta x=g(x)$
高斯牛顿寻找最优值

给定某个初值 $x_0$
进行k次迭代，寻找一个 $J(x_k)$ ,使 $f(x_k)$ 达到极小值
求解 $H(x)\Delta x_k=g(x)$
$\Delta x_k$ 足够小停止，否则令 $x_{k+1}=x_k+\Delta x_k$ ,转到第2步进行迭代

问题：H需要可逆,H不可逆时， $JJ^T$ 为奇异矩阵，增量的稳定性较差，导致算法不会收敛

阻尼牛顿法/列文伯格-马夸尔法/信赖区域法
在高斯牛顿法的基础上加上信赖区域即
$F(x)=\Delta x^*=argmin_{\Delta}\frac{1}{2}||f(x)+J(x)^T\Delta x||^2\\ st:||D\Delta x_k||^2\leq u$
构造拉格朗日函数
$\lambda:拉格朗日算子$
$\Gamma(\Delta x_k,\lambda)=\frac{1}{2}||f(x)+J(x)^T\Delta x||^2+\frac{\lambda}{2}(||D \Delta x_k||^2-u)$
令 $\Gamma'(\Delta x_k,\lambda)=0$ 得到：
$D^T D=I$
$(H+\lambda D^T D)\Delta x_k=g\\ (H+\lambda )\Delta x_k=g$
阻尼牛顿法/列文伯格-马夸尔法/信赖区域法寻找最优值

给定某个初值 $x_0$ ,以及初始优化范围 $u$
进行k次迭代，求解 $(H+\lambda )\Delta x_k=g$
计算 $p$ 衡量近似程度的好坏 $p=\frac{f(x+\Delta x)-f(x)}{J^T(x)\Delta x}$
$p > 3 / 4, u = 2 u$
$p < 1 / 4, u = 0.5 u$
$p > 设置的阈值$ ，令 $x_{k+1}=x_k+\Delta x_k$
判断算法收敛，不收敛返回第2步

磊磊哈哈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SLAM中非线性优化

这里是笔记，详细请查看链接线性最小二乘非线性最小二乘基础知识<UD分解>P:n阶正定的对称矩阵P:n阶正定的对称矩阵P:n阶正定的对称矩阵对矩阵P进行上三角-对角分解:U:上三角阵U:上三角阵U:上三角阵D:对角阵D:对角阵D:对角阵P=UDUTP=[P11P12...P1nP21P22...P2n............Pn1Pn2...Pnn],U=[U11U12...U1nU21U22...U2n............Un1Un2...Unn](Uii=1,(i=1,2
复制链接

扫一扫