Kalman filter 卡尔曼公式推导

氵巨木

已于 2022-10-26 16:44:44 修改

阅读量188

点赞数 1

分类专栏：卡尔曼滤波器文章标签：算法概率论矩阵

于 2022-10-18 11:42:19 首次发布

本文链接：https://blog.csdn.net/Strong__M/article/details/127384408

版权

卡尔曼滤波器专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Kalman filter

前言

最近学习了卡尔曼滤波器，所以整理在上面，之后如果有用到的话再看，这里就不再做前沿的介绍或者别的说明了，如果之后有空的话再做补充吧。最后附上一个扩展卡尔曼滤波器的例子，并附上 Matlab 代码。

文章目录

Kalman filter

公式推导

状态方程

状态方程的例子可以套在绝大多数情况（话不能说满），所以这里也就没有举具体的例子，如果大家想参考相关的例子，可以看最下面的参考连接，推荐哔哩哔哩 Up主 Dr_Can 的视频。

在自动控制原理中，连续系统状态方程表示如下：
$\begin{aligned} \dot{X} &= AX+Bu\\ Y&=CX+Du \end{aligned}$
其中 $X$ 为状态变量， $Y$ 为输出值或是待观测的变量， $u$ 为输入， $D$ 为输入对输出的直接影响，可以为 0 矩阵，所以上式也通常写为：

$\begin{aligned} \dot{X} &= AX+Bu\\ Y&=CX \end{aligned}$

为了实际处理，我们需要将状态方程离散化，离散化后为：

$\begin{aligned} X_k &= A_{k}X_{k-1}+B_ku_{k-1}\\ Z_k &= H_{k}X_{k} \end{aligned}$

注意：这里的 ${A_k},{B_k}$ 与离散化之前的值并不相同，要根据实际情况进行离散化。

实际情况中，无论是系统本身，还是观测器都伴随有噪声的影响，这也是要进行卡尔曼滤波的原因，加入噪声后得到如下公式：

真实值：

$\tag{1} X_k = A_{k}X_{k-1}+B_ku_{k-1} +w_{k-1}$

观测值：

$\tag{2} Z_k = H_{k}X_{k}+V_k$

其中

$w_{k-1}$ 为系统的噪声，符合高斯分布 $w_k \sim N(0,Q_k)$

$v_k$ 为测量噪声，符合高斯分布 $v_k \sim N(0,R_k)$

预测值：

$\tag{3} {\mathbf{\hat{X}}_k^-} = {A_k}{\mathbf{\hat{X}}_{k-1}} + {B_k}{u_k}$

注：因为无法知道 $w_{k}$ 的值，所以我们无法知道真实值 $X_k$ 的具体位置，但忽略噪声影响的预测值（先验估计值） ${\mathbf{\hat{X}}_k^-}$ ，可以通过带入上一次的计算值（后验估计值） ${\hat{X}}_{k-1}$ 得出。我们通过预测值，就得到了关于真实值 $X_k$ 的高斯分布预测真实值 $X_k\sim N({{\hat{X}}_k^-},P_k^-)$

其中 $P_k^-$ 为先验估计的协方差矩阵
$\begin{aligned} {P_k^-} &= E(e_k^-,e_k^{-T})\\ e{_k^-} &= (X_{k}-{\hat{X}_k^-})\\ \end{aligned}$

先验估计误差 $e{_k^-}$
$\begin{aligned} e{_k^-}&=X_{k}-{\hat{X}_k^-}\\ &= AX_{k-1}+Bu_{k-1}+w_{k-1}-(A\hat{X}_{k-1}+Bu_{k-1})\\ &= A(X_{k-1}-\hat{X}_{k-1})+w_{k-1}\\ &= Ae_{k-1}+w_{k-1} \end{aligned}$
其中 $e^-_{k-1}$ 为后验误差

先验估计误差的协方差矩阵 ${P_k^-}$ ：
$\begin{aligned} {P_k^-}&= E(e_k^-,e_k^{-T})\\ &= E[(Ae_{k-1}+w_{k-1})(Ae_{k-1}+w_{k-1})^T]\\ &= E[(Ae_{k-1}+w_{k-1})({e^T_{k-1}}A^T+w^T_{k-1})]\\ &= E[Ae_{k-1}{e^T_{k-1}}A^T+Ae_{k-1}w^T_{k-1}+w_{k-1}{e^T_{k-1}}A^T+w_{k-1}w^T_{k-1}]\\ &= AE(e_{k-1}{e^T_{k-1}})A^T+AE(e_{k-1}w^T_{k-1})+E(w_{k-1}{e^T_{k-1}})A^T+E(w_{k-1}w^T_{k-1})\\ \end{aligned}$
其中由于 $e_{k-1}$ 与 $w_{k-1}$ 相互独立，所以 $AE(e_{k-1}w^T_{k-1})$ 、 $E(w_{k-1}{e^T_{k-1}})A^T$ 两项为 $0$ 。 $E(w_{k-1}w^T_{k-1}) = Q_{k-1}$ $E(e_{k-1}{e^T_{k-1}}) = P_{k-1}$ ，所以上式可简化为：
$\tag{4} {P_k^-}= AP_{k-1}A^T+Q_{k-1}$
对于观测值 $Z_k = H_{k}X_{k}+V_k$
$\begin{aligned} Z_k &= H_{k}X_{k}+V_k\\ H_{k}X_{k} &= Z_k-V_k\\ X_{k} &= {H_{k}^{-1}}(Z_k-V_k)\\ \end{aligned}$
由于无法建模观测噪声 $V_k$ 的影响，所以
$X_{mea\_k} = {H_{k}^{-1}}Z_k$

数据融合

至此，我们就知道了两个数据来源，一个是我们根据公式 3 进行的预测值，一个是我们根据观测获得的测量值，这两个值都有误差，且误差都服从高斯分布，这就需要我们通过数据融合的思想，来获取更为精确的数据。

后验估计

采用数据融合的思想，新的预测数据 $\hat{X}_{k}$ 由下式获得：
$\begin{aligned} {\hat{X}_{k}}&={\hat{X}_k^-}+{G_k}(X_{mea\_k}-{\hat{X}_k^-})\\ &={\hat{X}_k^-}+{G_k}({H_{k}^{-1}}Z_k-{\hat{X}_k^-})\\\\ &令 G_k = {K_k}{H_{k}}\\ &={\hat{X}_k^-}+{K_k}{H_{k}}({H_{k}^{-1}}Z_k-{\hat{X}_k^-})\\ &={\hat{X}_k^-}+{K_k}(Z_k-{H_{k}}{\hat{X}_k^-})\\ \end{aligned}$

$\tag{5} {\hat{X}_{k}}={\hat{X}_k^-}+{K_k}(Z_k-{H_{k}}{\hat{X}_k^-})\\$

则Kalman Gain $K_k$ 的取值范围为：
$\begin{aligned} &K_k\in[0,H{_k^{-1}}]\\ when:&K_k = 0,&\hat{X}_{k}&={\hat{X}_k^-}\\ when :&K_k = H{_k^{-1}},&\hat{X}_{k}&=X_{mea\_k} \end{aligned}$

这样就变成如下目标，寻找 $K_k$ 值，使得后验误差 $X_k-\hat{X}_k$ 误差最小。
$e_k=X_k-\hat{X}_k$

后验误差的协方差矩阵

$P_k=E(e,e^T)= \begin{bmatrix} \sigma_{e_1}^2 & \sigma_{e_1e_2} \\ \sigma_{e_2e_1} & \sigma_{e_2}^2 \\ \end{bmatrix}$

希望误差最小，既 $\hat{X}_k$ 越接近 $X_k$ ，既方差最小，既 $P_k$ 的 $tr(P_k)$ 最小。
$\begin{aligned} X_k-\hat{X}_k&= X_k-{\hat{X}_k^-}-{K_k}({Z_k}-{H_k}{\hat{X}_k^-})\\ &= X_k-{\hat{X}_k^-}-{K_k}{Z_k}+{K_k}{H_k}{\hat{X}_k^-}\\ &= X_k-{\hat{X}_k^-}-{K_k}({H_k}{X_k}+{V_k})+{K_k}{H_k}{\hat{X}_k^-}\\ &= X_k-{\hat{X}_k^-}-{K_k}{H_k}{X_k}-{K_k}{V_k}+{K_k}{H_k}{\hat{X}_k^-}\\ &= (X_k-{\hat{X}_k^-})-{K_k}{H_k}({X_k}-{\hat{X}_k^-})-{K_k}{V_k}\\ &= (I-{K_k}{H_k})({X_k}-{\hat{X}_k^-})-{K_k}{V_k}\\ &= (I-{K_k}{H_k}){e_k^-}-{K_k}{V_k}\\ \end{aligned}$

协方差矩阵：
$\begin{aligned} P_k &= E(e,e^T)\\ &= E(({X_k}-{\hat{X}_k})({X_k}-{\hat{X}_k})^T)\\ &= E((I-{K_k}{H_k}){e_k^-}-{K_k}{V_k})((I-{K_k}{H_k}){e_k^-}-{K_k}{V_k})^T)\\ &= E((I-{K_k}{H_k}){e_k^-}-{K_k}{V_k})({{e_k^-}^T}(I-{K_k}{H_k})^T-{V_k^T}{K_k^T})^T)\\ &= E((I-{K_k}{H_k}){e_k^-}{{e_k^-}^T}(I-{K_k}{H_k})^T-(I-{K_k}{H_k}){e_k^-}{V_k^T}{K_k^T} -{K_k}{V_k}{{e_k^-}^T}(I-{K_k}{H_k})^T+{K_k}{V_k}{V_k^T}{K_k^T})\\ &= E((I-{K_k}{H_k}){e_k^-}{{e_k^-}^T}(I-{K_k}{H_k})^T) - E((I-{K_k}{H_k}){e_k^-}{V_k^T}{K_k^T}) - E({K_k}{V_k}{{e_k^-}^T}(I-{K_k}{H_k})^T) + E({K_k}{V_k}{V_k^T}{K_k^T})\\ \end{aligned}$
其中：
$E((I-{K_k}{H_k}){e_k^-}{V_k^T}{K_k^T}) = (I-{K_k}{H_k})E({e_k^-}{V_k^T}){K_k^T}\\ E({K_k}{V_k}{{e_k^-}^T}(I-{K_k}{H_k})^T) ={K_k}E({V_k}{{e_k^-}^T})(I-{K_k}{H_k})^T$
在 $E({V_k}{{e_k^-}^T})$ 中 ${V_k}与{{e_k^-}^T}$ 相互独立，故上面两个式子都为0.
$\begin{aligned} P_k &= E(e,e^T)\\ &= E((I-{K_k}{H_k}){e_k^-}{{e_k^-}^T}(I-{K_k}{H_k})^T) + E({K_k}{V_k}{V_k^T}{K_k^T})\\ &= (I-{K_k}{H_k}){P_k^-}(I-{K_k}{H_k})^T + {K_k}{R_k}{K_k^T}\\ &= ({P_k^-}-{K_k}{H_k}{P_k^-})(I-{K_k}{H_k})^T + {K_k}{R_k}{K_k^T}\\ &= {P_k^-} - {K_k}{H_k}{P_k^-} - {P_k^-}{H_k^T}{K_k^T} + {K_k}{H_k}{P_k^-}{H_k^T}{K_k^T} + {K_k}{R_k}{K_k^T} \end{aligned}$

协方差矩阵的迹

$\begin{aligned} & tr(P_k) &&\\ =& tr({P_k^-}) - tr({K_k}{H_k}{P_k^-}) - tr({P_k^-}{H_k^T}{K_k^T})+ tr({K_k}{H_k}{P_k^-}{H_k^T}{K_k^T}) + tr({K_k}{R_k}{K_k^T})\\ =& tr({P_k^-}) - 2tr({K_k}{H_k}{P_k^-}) + tr({K_k}{H_k}{P_k^-}{H_k^T}{K_k^T}) + tr({K_k}{R_k}{K_k^T})\\ \end{aligned} \begin{aligned} &因为：\\ &tr(A) = tr(A^T)\\ &{(({P_k^-}{H_k^T}){K_k^T})^T}={K_k}{H_k}{{P_k^-}^T}\\ &{P_k^-}是对称矩阵{P_k^-}={{P_k^-}^T} \end{aligned}$

求 $K_k$ 的最小值，即 $tr(P_k)$ 对 $K_k$ 求导：
$\begin{aligned} &\frac{d(tr(P_k))}{d(K_k)}=0 - 2({H_k}{{P_k^-}})^T+2{K_k}{H_k}{P_k^-}{H_k^T}+2{K_k}{R_k}&&&\\ \end{aligned} \begin{aligned} 因为：&\\ &\frac{d(tr(AB))}{d(A)}=B^T\\ &\frac{d(tr(AB{A^T}))}{d(A)}=2AB\\ \end{aligned}\\$
令 $\frac{d(tr(P_k))}{d(K_k)}=0$
$\begin{aligned} -2({H_k}{{P_k^-}})^T+2{K_k}{H_k}{P_k^-}{H_k^T}+2{K_k}{R_k}&=0&&&&&&&&&&\\ {K_k}{H_k}{P_k^-}{H_k^T}+{K_k}{R_k}&=({H_k}{{P_k^-}})^T\\ {K_k}({H_k}{P_k^-}{H_k^T}+{R_k})&={{P_k^-}^T}{H_k^T}\\ \end{aligned}$

卡尔曼增益

$\tag{6} {K_k}=\frac{{{P_k^-}^T}{H_k^T}}{{H_k}{P_k^-}{H_k^T}+{R_k}}\\$

同时：
$\begin{aligned} P_k &= {P_k^-} - {K_k}{H_k}{P_k^-} - {P_k^-}{H_k^T}{K_k^T} + {K_k}{H_k}{P_k^-}{H_k^T}{K_k^T} + {K_k}{R_k}{K_k^T}\\ &= {P_k^-} - {K_k}{H_k}{P_k^-} - {P_k^-}{H_k^T}{K_k^T} + {K_k}({H_k}{P_k^-}{H_k^T} + {K_k}{R_k}){K_k^T}\\ &= {P_k^-} - {K_k}{H_k}{P_k^-} - {P_k^-}{H_k^T}{K_k^T} + {P_k^-}{H_k^T}{K_k^T}\\ &= {P_k^-} - {K_k}{H_k}{P_k^-}\\ &= (I - {K_k}{H_k}){P_k^-}\\ \end{aligned}$

$\tag{7} P_k = (I - {K_k}{H_k}){P_k^-}\\$

至此，公式推导结束。

卡尔曼滤波器的使用

计算先验估计值
${\mathbf{\hat{X}}_k^-} = {A_k}{\mathbf{\hat{X}}_{k-1}} + {B_k}{u_k}$
更新先验误差的协方差矩阵
${P_k^-}= AP_{k-1}A^T+Q_{k-1}$
计算Kalman Gain
${K_k}=\frac{{{P_k^-}^T}{H_k^T}}{{H_k}{P_k^-}{H_k^T}+{R_k}}\\$
计算后验估计
${\hat{X}_{k}}={\hat{X}_k^-}+{K_k}(Z_k-{H_{k}}{\hat{X}_k^-})$
更新误差协方差矩阵

$P_k = (I - {K_k}{H_k}){P_k^-}$

参考

【1】【卡尔曼滤波器】3_卡尔曼增益超详细数学推导～全网最完整_哔哩哔哩_bilibili

【2】通过简单直观的推导理解卡尔曼基础)Understanding the Basis of the Kalman Filter Via a Simple and Intuitive Derivation_tuszhangs的博客-CSDN博客

【3】Understanding the Basis of the Kalman Filter Via a Simple and Intuitive Derivation (Lecture Note | IEEE Journals & Magazine | IEEE Xplore )

【4】轻松理解卡尔曼滤波 - 知乎

【5】How a Kalman filter works, in pictures | Bzarg

【6】kalman滤波理解一：理论框架_还差得远呢的博客-CSDN博客

【7】probability - Is the product of two Gaussian random variables also a Gaussian? - Mathematics Stack Exchange

例子

这是一个基于扩展卡尔曼滤波器的例子
在这里插入图片描述

clear
clc
%初始参数
%状态函数：
[ x_k v_xk y_k v_yk]'
X = [0 10 200 0]';
t = 10;
T = 0.1;
m = 1;
kx = 0.01;
ky = 0.05;
g = -9.8;
Status = [T,g,m,kx,ky];
I = eye(4);

H = zeros(2,4);


% 初始的误差协方差矩阵
P_k1  = zeros(4,4);
% 噪声
Q = zeros(4,4);
Q(2,2) = 5;
Q(4,4) = 5;
R = eye(2);
R(1,1) = 0.0004;
R(2,2) = 3;
P_k1,Q,R
X_real = X;
X_real1 = X;
X_head1 = X;
X_headp = zeros(4,1);
X_head = zeros(4,1);


XY = zeros(t/T,4);
ZZ = zeros(t/T,2);

%生成 A，H 矩阵
A = [1          T               0       0; 
     0   1-2*T/m*kx*X(2)        0       0; 
     0          0               1       T;
     0          0               0   1+2*T/m*ky*X(4)];
H = zeros(2,4);

%迭代计算
rng(10);
for i = 1: t/T
    % 构造真实值
    X_real = CreatRealDatas(X_real1, Status, Q);
    % 构造观测值
    Zk = CreatObserveDatas(X_real, R);
    % 计算先验值
    X_headp = CalculatePriorValue(X_head1, Status);
    % 更新 A H 矩阵
    [A, H] = UpdateAHmatrix(X_head1, Status);
    % 误差协方差矩阵 Pk 的先验值
    Pkp = A*P_k1*A' + Q;
    % 计算 Kalman Gain
    Kk = Pkp*H'*(H*Pkp*H'+ R)^-1;
    % 计算 后验估计
    

    ZZ_a = atan(X_headp(1)/X_headp(3));
    ZZ_r = sqrt(X_headp(1)^2 + X_headp(3)^2);
    abc = [ZZ_a,ZZ_r]';
    

    % X_head = X_headp + Kk*(Zk - H*X_headp);
    X_head = X_headp + Kk*(Zk - abc);
    % 更新误差的协方差矩阵
    Pk = (I - Kk*H)*Pkp;
%数据更新
   
    X_real1 = X_real;
    X_head1 = X_head;
    P_k1 = Pk;
    
    XY(i,:) = X_real;
    Xh(i,:) = X_head;
    ZZ(i,:) = Zk;
end

%绘制图像
figure(1)
hold on
ZZ2 = [ZZ(:,2).*sin(ZZ(:,1)),ZZ(:,2).*cos(ZZ(:,1))];
plot(XY(:,1),XY(:,3),'r');
plot(ZZ2(:,1),ZZ2(:,2),'*');
plot(Xh(:,1),Xh(:,3),'g');

figure(2)
hold on
plot(XY(:,2),'r')
plot(XY(:,4),'b')

函数创建

构造真实值

function X_real = CreatRealDatas(X_real1, Status, Q)
    X_k1 = X_real1(1); V_xk1 = X_real1(2); Y_k1 = X_real1(3); V_yk1 = X_real1(4);
    T = Status(1); g = Status(2); m = Status(3); kx =Status(4); ky = Status(5);
    
    X_k = X_k1 + T*V_xk1;
    if V_xk1 >= 0
        V_xk = V_xk1 - T/m*kx * V_xk1*V_xk1 + Q(2,2)^0.5*randn(1)*T;
    else
        V_xk = V_xk1 + T/m*kx * V_xk1*V_xk1 + Q(2,2)^0.5*randn(1)*T;
    end
    
    Y_k = Y_k1 + T*V_yk1;
    if V_yk1 >= 0
        V_yk = V_yk1 + T*g - T/m*ky * V_yk1*V_yk1  + Q(4,4)^0.5*randn(1)*T;
    else
        V_yk = V_yk1 + T*g + T/m*ky * V_yk1*V_yk1  + Q(4,4)^0.5*randn(1)*T;
    end
    X_real = [X_k V_xk Y_k V_yk]';
end

构造观测值

function Zk = CreatObserveDatas(X_real, R)

    X_k = X_real(1); Y_k = X_real(3);
 
    Z_a = atan(X_k/Y_k) + R(1,1)^0.5*randn(1);
    Z_r = sqrt(X_k^2 + Y_k^2) + R(2,2)^0.5*randn(1);
    Zk = [Z_a;Z_r];
end

计算先验值

function X_headp = CalculatePriorValue(X_head1, Status)

    T = Status(1); g = Status(2); m = Status(3); kx =Status(4); ky = Status(5);
    
    X_k = X_head1(1) + T*X_head1(2);
    if X_head1(2) >= 0
        V_xk = X_head1(2) - T/m*kx * X_head1(2)*X_head1(2);
    else
        V_xk = X_head1(2) + T/m*kx * X_head1(2)*X_head1(2);
    end
    
    Y_k = X_head1(3) + T*X_head1(4);
    if X_head1(4) >= 0
        V_yk = X_head1(4) + T*g - T/m*ky * X_head1(4)*X_head1(4);
    else
        V_yk = X_head1(4) + T*g + T/m*ky * X_head1(4)*X_head1(4);
    end
    X_headp = [X_k V_xk Y_k V_yk]';
end

更新 A，H 矩阵

function [A, H] = UpdateAHmatrix(X_head1, Status)
    
    T = Status(1); g = Status(2); m = Status(3); kx =Status(4); ky = Status(5);
    
    A = zeros(4);
    
    A(1,1) = 1;
    A(1,2) = T;
    A(2,2) = 1-2*T/m*kx*X_head1(2);
    A(3,3) = 1;
    A(3,4) = T;
    A(4,4) = 1+2*T/m*ky*X_head1(4);
    
    H = zeros(2,4);
    
    H(1,1) = X_head1(3)/(X_head1(1)^2 + X_head1(3)^2);
    H(1,3) = X_head1(1)/(X_head1(1)^2 + X_head1(3)^2);
    H(2,1) = X_head1(1)/sqrt(X_head1(1)^2 + X_head1(3)^2);
    H(2,3) = X_head1(3)/sqrt(X_head1(1)^2 + X_head1(3)^2);
end