卡尔曼滤波通过观测值和估计值求位移、速度、加速度

最新推荐文章于 2024-06-04 22:53:49 发布

Chen_Chance

最新推荐文章于 2024-06-04 22:53:49 发布

阅读量1.6k

点赞数 34

文章标签：性能优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44154915/article/details/137653934

版权

本文介绍了三种动量更新公式在机器学习和优化算法中的应用，包括基本的梯度下降、引入动量项的改进方法以及考虑二阶导数的二阶动量，这些公式通过调整参数估计与观测值的关系，以加速模型收敛。

摘要由CSDN通过智能技术生成

在这里插入图片描述
这三个公式描述了动量更新方法,用于优化算法中更新参数的方式。

$\hat{x}_{n,n} = \hat{x}_{n,n-1} + \alpha (z_n - \hat{x}_{n,n-1})$

$\hat{x}_{n,n} = \hat{x}_{n,n-1} + \beta \left(\frac{z_n - \hat{x}_{n,n-1}}{\Delta t}\right)$

$\hat{x}_{n,n} = \hat{x}_{n,n-1} + \gamma \left(\frac{z_n - \hat{x}_{n,n-1}}{0.5\Delta t^2}\right)$

其中:

$\hat{x}_{n,n}$ 表示当前时刻 n 的参数估计值
$\hat{x}_{n,n-1}$ 表示上一时刻 n-1 的参数估计值
$z_n$ 表示当前时刻 n 的观测值或目标值
$\alpha$ 、 $\beta$ 、 $\gamma$ 是步长或学习率参数
$\Delta t$ 表示时间步长

这三个公式分别对应不同的动量更新方式,反映了估计值与观测值之间的差异被纳入更新的不同方式。它们常用于机器学习和优化算法中,用于调整模型参数以最小化损失函数或目标函数。

如何推导得来的

这三个公式实际上是描述了三种不同的动量更新方法,它们都是基于牛顿迭代法的思想推导得到的。

第一个公式是最基本的梯度下降法更新公式:

$\hat{x}_{n,n} = \hat{x}_{n,n-1} + \alpha (z_n - \hat{x}_{n,n-1})$

其中 $\alpha$ 是步长,它根据目标函数对参数 $x$ 的梯度进行更新。

第二个公式引入了动量项:

$\hat{x}_{n,n} = \hat{x}_{n,n-1} + \beta \left(\frac{z_n - \hat{x}_{n,n-1}}{\Delta t}\right)$

它将目标函数对参数 $x$ 的梯度近似为 $(z_n - \hat{x}_{n,n-1})/\Delta t$ ,即在时间步长 $\Delta t$ 内的变化率。 $\beta$ 是动量系数,通过加入过去的梯度信息来加速收敛。

第三个公式进一步引入了二阶动量项:

$\hat{x}_{n,n} = \hat{x}_{n,n-1} + \gamma \left(\frac{z_n - \hat{x}_{n,n-1}}{0.5\Delta t^2}\right)$

它将目标函数对参数 $x$ 的梯度近似为 $(z_n - \hat{x}_{n,n-1})/(0.5\Delta t^2)$ ,即在时间步长 $\Delta t$ 内的加速度变化。 $\gamma$ 是二阶动量系数,通过加入过去的加速度信息来进一步加速收敛。

这些公式的推导思路源自于牛顿迭代法,通过近似目标函数的一阶和二阶导数并结合前一时刻的状态进行参数更新,从而达到加速优化收敛的目的。不同的动量更新方法对应于不同的导数近似方式。

0.5怎么得到的

公式中0.5的存在是为了近似二阶导数。具体来说:

$\hat{x}_{n,n} = \hat{x}_{n,n-1} + \gamma \left(\frac{z_n - \hat{x}_{n,n-1}}{0.5\Delta t^2}\right)$

这个公式试图用 $(z_n - \hat{x}_{n,n-1})/(0.5\Delta t^2)$ 来近似目标函数对参数 $x$ 的二阶导数,即加速度。

在数值计算中,常用有限差分法来近似导数。对于一个函数 $f (x)$ ,它的一阶导数可以用如下方式近似:

$\approx \frac{f(x+\Delta x) - f(x)}{\Delta x}$

而二阶导数可以用如下方式近似:

$\approx \frac{f(x+\Delta x) - 2f(x) + f(x-\Delta x)}{\Delta x^2}$

注意到上式分母的 $\Delta x^2$ 。

将此思路应用到时间域,用 $\Delta t$ 替代 $\Delta x$ ,就有:

$\frac{d^2x}{dt^2} \approx \frac{x(t+\Delta t) - 2x(t) + x(t-\Delta t)}{\Delta t^2}$

进一步化简,我们可以得到:

$\frac{d^2x}{dt^2} \approx \frac{x(t+\Delta t) - x(t)}{\Delta t^2/2}$

所以0.5就是为了对应上面这个二阶导数的近似形式,使得 $(z_n - \hat{x}_{n,n-1})/(0.5\Delta t^2)$ 可以近似加速度项。

关注

34
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
卡尔曼滤波通过观测值和估计值求位移、速度、加速度

这三个公式描述了动量更新方法,用于优化算法中更新参数的方式。xnnxnn−1αzn−xnn−1xnnxnn−1βΔtzn−xnn−1xnnxnn−1γ0.5Δt2zn−xnn−1xnnxnn−1znαβγΔt这三个公式分别对应不同的动量更新方式,反映了估计值与观测值之间的差异被纳入更新的不同方式。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。