高斯牛顿法 Guass-Newton

最新推荐文章于 2024-07-26 17:10:31 发布

caiexu

最新推荐文章于 2024-07-26 17:10:31 发布

阅读量5.1k

点赞数

求最优估计

x ∗ x∗，使得误差(残差)向量的

ϵ=f(x ∗ )−z ϵ=f(x∗)−z的平方和

S(x)=ϵ T ϵ S(x)=ϵTϵ最小，即求

x * = arg min x ϵ T ϵ = arg min x S (x) = arg min x ∥ f (x) - z ∥ 22 (1)

最理想的情况，误差 ϵ=0 ，此时 f(x ∗ )=z ，故最优化问题 (1) 等价于“解方程”问题：

f (x) = z (2)

大部分非线性最优化算法需要迭代求解

x : = x + δ

若已有初值

x x，每次迭代需要求解一个最优增量

δ δ，使得迭代后的“预测输出”

f(x+δ) f(x+δ)与实际的观测值

z z的误差

∥f(x+δ)−z∥ ‖f(x+δ)−z‖最小。

对误差向量线性化，有

f (x + δ) - z \approx f (x) + J δ - z

其中，

J=∂f(x)∂x J=∂f(x)∂x为

f(x) f(x)的雅克比矩阵。令上式为

0 0，就变成了解线性方程问题

J δ = ϵ, ϵ = z - f (x)

实际应用中，上式往往是超定的，故用线性最小二乘法求解，

J T J δ = J T ϵ \Leftrightarrow δ * = arg min δ ∥ J δ - ϵ ∥ 22 (3)

故非线性最优化问题变成了迭代求解线性方程的问题。上述算法又称为\emph{高斯牛顿法}。

如果已知观测 z 的协方差的矩阵 Σ ，应该对指标函数按方差 Σ 加权，方差大的观测分量权重小，对结果的影响小。引入方差加权后， (1) 中的优化问题变成

x * = arg min x S (x) = arg min x ϵ T Σ - 1 ϵ = arg min x ∥ f (x) - z ∥ 2 Σ - 1 (4)

要解决上述问题，则在每一次迭代过程中求解

δ * = arg min δ ∥ J δ - ϵ ∥ 2 Σ - 1 (5)

设信息矩阵 Σ −1 有Cholesky分解

Σ - 1 = A T A (6)

则

(5) (5)的指标函数可以改写成

∥ J δ - ϵ ∥ 2 Σ - 1 = (J δ - ϵ) T A T A (J δ - ϵ) = ∥ (A J) δ - A ϵ ∥ 22 (7)

只需令

J ~ =AJ J~=AJ，

ϵ ~ =Aϵ ϵ~=Aϵ，

(7) (7)变成

∥J ~ δ−ϵ ~ ∥ 2 2 ‖J~δ−ϵ~‖22，故加权问题

(5) (5)可以转化为非加权问题

(3) (3)。利用

(3) (3)中“

⇔ ⇔”左右两侧的等价关系，问题

(5) (5)中最优增量

δ δ由下式确定：

J T Σ - 1 J δ = J T Σ - 1 ϵ (8)

在实际操作中，不需要进行Cholesky分解

(6) (6)，只需在每一次迭代过程中求解

(8) (8)即可。

可以证明， (8) 中 J T Σ −1 J 为能量函数 S(x) 的Hessian矩阵； J T Σ −1 为能量函数的梯度。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。