Kalman filtering卡尔曼滤波和Particle Filter粒子滤波及其MATLAB实现


前言

通过寻找一组在状态空间中传播的随机样本来近似的表示概率密度函数,用样本均值代替积分运算,进而获得系统状态的最小方差估计的过程,这些样本被形象的称为“粒子”,故而叫粒子滤波。如有错误还望指出。参考自:机器学习-白板推导系列(十六)-粒子滤波(Particle Filter)


一、基本概念和铺垫

1.两个假设

齐次Markov假设:状态变量zt只与上一个时刻的zt-1有关。
观测独立假设:观测变量xt只与对应zt有关。

2.卡尔曼滤波(线性)

公式:
z t = g ( z t − 1 , u , ε ) = A ⋅ z t − 1 + B + ε , z_{t}=g(z_{t-1},u,\varepsilon)=A \cdot z_{t-1}+B+ \varepsilon, zt=g(zt1,u,ε)=Azt1+B+ε
其中, A A A B B B为矩阵, ε \varepsilon ε为符合高斯分布的随机变量 ε ∼ N ( 0 , Q ) \varepsilon \sim N(0,Q) εN(0,Q) u u u为外部输入,根据情况可有也可以没有。
x t = h ( z t , u , δ ) = C ⋅ z t + D + δ . x_{t}=h(z_{t},u,\delta)=C \cdot z_{t}+D+ \delta. xt=h(zt,u,δ)=Czt+D+δ.
其中, C C C D D D为矩阵, δ \delta δ为符合高斯分布的随机变量 δ ∼ N ( 0 , R ) \delta \sim N(0,R) δN(0,R)
问题:求解 p ( z t ∣ x 1 , . . . , x t ) p(z_{t}|x_{1},...,x_{t}) p(ztx1,...,xt)

Step1:Prediction预测——给 z t z_{t} zt一个先验
p ( z t ∣ x 1 , . . . , x t − 1 ) = ∫ z t − 1 p ( z t ∣ z t − 1 ) ⋅ p ( z t − 1 ∣ x 1 , . . . , x t − 1 ) d z t − 1 p(z_{t}|x_{1},...,x_{t-1})= \int_{z_{t-1}} p(z_{t}|z_{t-1}) \cdot p(z_{t-1}|x_{1},...,x_{t-1}) dz_{t-1} p(ztx1,...,xt1)=zt1p(ztzt1)p(zt1x1,...,xt1)dzt1
Step2:Update更新——求 z t z_{t} zt的后验
p ( z t ∣ x 1 , . . . , x t ) ∝ p ( x t ∣ z t ) ⋅ p ( z t ∣ x 1 , . . . , x t − 1 ) p(z_{t}|x_{1},...,x_{t}) \propto p(x_{t}|z_{t}) \cdot p(z_{t}|x_{1},...,x_{t-1}) p(ztx1,...,xt)p(xtzt)p(ztx1,...,xt1)

3.粒子滤波(非线性)

由于其非线性特性,难以求出解析解,因此通过采样求出后验。

二、粒子滤波具体步骤

1.重要性采样Importance Sampling&SIS

Monte Carlo Method:

由大数定理可有求得期望,
E z ∣ x [ f ( z ) ] = ∫ f ( z ) ⋅ p ( z ∣ x ) d x ≈ 1 N ∑ i = 1 N f ( z i ) E_{z|x}[f(z)]=\int f(z) \cdot p(z|x) dx \approx \frac{1}{N} \sum^{N}\limits_{i=1} f(z^{i}) Ezx[f(z)]=f(z)p(zx)dxN1i=1Nf(zi)
其中 N N N个样本, z i ∼ p ( z ∣ x ) z^i \sim p(z|x) zip(zx)

Importance Sampling:

引入一个新的可行的提议分布(proposed distribution) q ( z ∣ x ) q(z|x) q(zx),同样利用大数分布,可得,
E z ∣ x [ f ( z ) ] = ∫ f ( z ) ⋅ p ( z ∣ x ) q ( z ∣ x ) ⋅ q ( z ∣ x ) d x ≈ 1 N ∑ i = 1 N f ( z i ) ⋅ p ( z i ∣ x ) q ( z i ∣ x ) = 1 N ∑ i = 1 N f ( z i ) ⋅ w i E_{z|x}[f(z)]=\int f(z) \cdot \frac{p(z|x)}{q(z|x)} \cdot q(z|x) dx \approx \frac{1}{N} \sum^{N}\limits_{i=1} f(z^{i})\cdot \frac{p(z^i|x)}{q(z^i|x)} =\frac{1}{N} \sum^{N}\limits_{i=1} f(z^{i})\cdot w^{i} Ezx[f(z)]=f(z)q(zx)p(zx)q(zx)dxN1i=1Nf(zi)q(zix)p(zix)=N1i=1Nf(zi)wi
Filtering:
下文将 x 1 , x 2 , . . . , x t x_1,x_2,...,x_t x1,x2,...,xt简写为 x 1 : t x_{1:t} x1:t,要求 p ( z t ∣ x 1 : t ) p(z_t|x_{1:t}) p(ztx1:t),由上文的重采样可有得到权重(weight),
w t i = p ( z t i ∣ x 1 : t ) q ( z t i ∣ x 1 : t ) w_{t}^{i}=\frac{p(z_t^i|x_{1:t})}{q(z_t^i|x_{1:t})} wti=q(ztix1:t)p(ztix1:t)

Sequential Importance Sampling:

由上述提出,为解决由 w t i w_t^i wti推算出 w t − 1 i w_{t-1}^i wt1i,以此降低计算量。用于求 p ( z 1 : t ∣ x 1 : t ) p(z_{1:t}|x_{1:t}) p(z1:tx1:t),而非边缘后验 p ( z t ∣ x 1 : t ) p(z_t|x_{1:t}) p(ztx1:t)
推导过程:
p ( z 1 : t ∣ x 1 : t ) p(z_{1:t}|x_{1:t}) p(z1:tx1:t)
根据贝叶斯公式:
= p ( z 1 : t , x 1 : t ) p ( x 1 : t ) = p ( z 1 : t , x 1 : t ) C =\frac{p(z_{1:t},x_{1:t})}{p(x_{1:t})} \\ =\frac{p(z_{1:t},x_{1:t})}{C} =p(x1:t)p(z1:t,x1:t)=Cp(z1:t,x1:t)
其中, p ( x 1 : t ) p(x_{1:t}) p(x1:t)可以视为常量 C C C,继续根据贝叶斯公式分解得,
= 1 C ⋅ p ( x t ∣ z 1 : t , x 1 : t − 1 ) ⋅ p ( z 1 : t , x 1 : t − 1 ) =\frac{1}{C} \cdot p(x_t|z_{1:t},x_{1:t-1}) \cdot p(z_{1:t},x_{1:t-1}) =C1p(xtz1:t,x1:t1)p(z1:t,x1:t1)
根据观测独立假设,得到,
= 1 C ⋅ p ( x t ∣ z t ) ⋅ p ( z 1 : t , x 1 : t − 1 ) =\frac{1}{C} \cdot p(x_t|z_{t}) \cdot p(z_{1:t},x_{1:t-1}) =C1p(xtzt)p(z1:t,x1:t1)
再次利用贝叶斯公式分解,这次分解状态变量,得,
= 1 C ⋅ p ( x t ∣ z t ) ⋅ p ( z t ∣ z 1 : t − 1 , x 1 : t − 1 ) ⋅ p ( z 1 : t − 1 , x 1 : t − 1 ) =\frac{1}{C} \cdot p(x_t|z_{t}) \cdot p(z_t|z_{1:t-1},x_{1:t-1}) \cdot p(z_{1:t-1},x_{1:t-1}) =C1p(xtzt)p(ztz1:t1,x1:t1)p(z1:t1,x1:t1)
根据齐次Markov假设,简化得到,
= 1 C ⋅ p ( x t ∣ z t ) ⋅ p ( z t ∣ z t − 1 ) ⋅ p ( z 1 : t − 1 , x 1 : t − 1 ) = 1 C ⋅ p ( x t ∣ z t ) ⋅ p ( z t ∣ z t − 1 ) ⋅ p ( z 1 : t − 1 ∣ x 1 : t − 1 ) ⋅ p ( x 1 : t − 1 ) =\frac{1}{C} \cdot p(x_t|z_{t}) \cdot p(z_t|z_{t-1}) \cdot p(z_{1:t-1},x_{1:t-1}) \\ =\frac{1}{C} \cdot p(x_t|z_{t}) \cdot p(z_t|z_{t-1}) \cdot p(z_{1:t-1}|x_{1:t-1}) \cdot p(x_{1:t-1}) =C1p(xtzt)p(ztzt1)p(z1:t1,x1:t1)=C1p(xtzt)p(ztzt1)p(z1:t1x1:t1)p(x1:t1)
其中 p ( x 1 : t − 1 ) p(x_{1:t-1}) p(x1:t1)可以视为常量 D D D
= D C ⋅ p ( x t ∣ z t ) ⋅ p ( z t ∣ z t − 1 ) ⋅ p ( z 1 : t − 1 ∣ x 1 : t − 1 ) =\frac{D}{C} \cdot p(x_t|z_{t}) \cdot p(z_t|z_{t-1}) \cdot p(z_{1:t-1}|x_{1:t-1}) =CDp(xtzt)p(ztzt1)p(z1:t1x1:t1)
假定有,
q ( z 1 : t ∣ x 1 : t ) = q ( z t ∣ z 1 : t − 1 , x 1 : t ) ⋅ q ( z 1 : t − 1 ∣ x 1 : t − 1 ) q(z_{1:t}|x_{1:t})=q(z_t|z_{1:t-1},x_{1:t}) \cdot q(z_{1:t-1}|x_{1:t-1}) q(z1:tx1:t)=q(ztz1:t1,x1:t)q(z1:t1x1:t1)
设定 q q q也符合两个假设,既,
q ( z 1 : t ∣ x 1 : t ) = q ( z t ∣ z t − 1 , x 1 : t ) ⋅ q ( z 1 : t − 1 ∣ x 1 : t − 1 ) q(z_{1:t}|x_{1:t})=q(z_t|z_{t-1},x_{1:t}) \cdot q(z_{1:t-1}|x_{1:t-1}) q(z1:tx1:t)=q(ztzt1,x1:t)q(z1:t1x1:t1)
带入权重中可得,
w t i ∝ p ( z t i ∣ x 1 : t ) q ( z t i ∣ x 1 : t ) ∝ p ( x t ∣ z t ) ⋅ p ( z t ∣ z t − 1 ) ⋅ p ( z 1 : t − 1 ∣ x 1 : t − 1 ) q ( z t ∣ z t − 1 ) ⋅ q ( z 1 : t − 1 ∣ x 1 : t − 1 ) = p ( x t ∣ z t ) ⋅ p ( z t ∣ z t − 1 ) q ( z t ∣ z t − 1 , x 1 : t ) ⋅ w t − 1 i w_{t}^{i} \propto \frac{p(z_t^i|x_{1:t})}{q(z_t^i|x_{1:t})} \propto \frac{p(x_t|z_{t}) \cdot p(z_t|z_{t-1}) \cdot p(z_{1:t-1}|x_{1:t-1})}{q(z_t|z_{t-1}) \cdot q(z_{1:t-1}|x_{1:t-1})} \\ =\frac{p(x_t|z_{t}) \cdot p(z_t|z_{t-1})}{q(z_t|z_{t-1},x_{1:t})} \cdot w_{t-1}^{i} wtiq(ztix1:t)p(ztix1:t)q(ztzt1)q(z1:t1x1:t1)p(xtzt)p(ztzt1)p(z1:t1x1:t1)=q(ztzt1,x1:t)p(xtzt)p(ztzt1)wt1i
算法过程:

前提: t − 1 t-1 t1时刻采样已完成→ w t − 1 i w^i_{t-1} wt1i已知
t t t时刻:
f o r   i = 1 , . . . , N for\ i=1,...,N for i=1,...,N
z t i ∼ q ( z t ∣ z t − 1 , x 1 : t ) z^i_t \sim q(z_t|z_t-1,x_{1:t}) ztiq(ztzt1,x1:t)
w t i ∝ p ( x t ∣ z t ) ⋅ p ( z t ∣ z t − 1 ) q ( z t ∣ z t − 1 , x 1 : t ) ⋅ w t − 1 i w_{t}^{i} \propto \frac{p(x_t|z_{t}) \cdot p(z_t|z_{t-1})}{q(z_t|z_{t-1},x_{1:t})} \cdot w_{t-1}^{i} wtiq(ztzt1,x1:t)p(xtzt)p(ztzt1)wt1i
e n d end end
w t i 归一化 w_{t}^{i}归一化 wti归一化

存在问题: 权值退化,个别权重接近一,其余权重很小
解决方案:(1)重采样。(2)选择一个合适的 q ( z ) q(z) q(z)

2.重采样Re-sampling

轮盘赌法

根据权重进行轮盘赌,权重对应被采样概率。如 x 1 , x 2 , x 3 x^1,x^2,x^3 x1,x2,x3的权重为分别为0.4,0.2,0.3,那么它们各自被采样的概率就是40%,20%,30%。

其余方法

多项式采样、系统重采样、残差重采样法

基本粒子滤波Basic Particle Filter

SIS+Re-sampling

3.SIR Filter

重新设定 q ( z ) q(z) q(z)为,
p ( z t ∣ z 1 : t , x 1 : t ) = p ( z t ∣ z t − 1 ) p(z_t|z_{1:t},x_{1:t})=p(z_t|z_{t-1}) p(ztz1:t,x1:t)=p(ztzt1)
带入权重中得,
w t i = p ( x t ∣ z t ) ⋅ w t − 1 i w_{t}^{i} =p(x_t|z_{t}) \cdot w_{t-1}^{i} wti=p(xtzt)wt1i

三、MATLAB程序实现

clc;clear all;close all;

%初始参数设置
z_delta = 1; %状态变量的随机变量的方差
x_delta = 1; %观测变量的随机变量的方差
z = 0; %状态变量初始值
x = z^2/5+sqrt(x_delta)*rand;%观测变量初始值,自定函数,用于生成样本
T = 100; %跟踪时长
N = 100; %粒子个数

%生成粒子
N_delta=2; %粒子的高斯分布方差
N_mu=x; %粒子的高斯分布均值
Particle=zeros(1,N); %初始化粒子
for i=1:N %产生符合高斯分布的粒子
    Particle(i)=N_mu+sqrt(N_delta)*randn;
end

%实际的样本数据
z_real=[z];%用于记录实际状态变量
x_real=[x];%用于记录实际观测变量
for t=2:T
    z=randn*sqrt(z_delta)+cos(z^2)*z/(2+z^2)+sin(t-1)*log(t);%随意设置的一个函数,z(t)只与z(t-1)有关
    x = z^2/5+sqrt(x_delta)*rand;%x(t)只与z(t)有关
    z_real=[z_real,z];%用于记录实际状态变量
    x_real=[x_real,x];%用于记录实际观测变量
end

%粒子滤波
for t=1:T
    
    for i=1:N
        %状态变量z从先验p(z(t)|z(t-1))中进行采样
        z_update(i)=randn*sqrt(z_delta)+cos(Particle(i)^2)*Particle(i)/(2+Particle(i)^2)+sin(t-1)*log(t);
        %计算对应的观测变量,为权重计算做准备
        x_update(i) = z_update(i)^2/5+sqrt(x_delta)*rand;
        %采用SIR方法,w(t)=p(x(t)|z(t))*w(t-1),采用噪声符合高斯分布
        w(i)= (1/sqrt(2*pi*x_delta)) * exp(-(x_real(t) - x_update(i))^2/(2*x_delta));
    end
    %将权重归一化
    w=w./(sum(w));%防止出现除0的情况
   
    %重采样
    for i = 1 : N    
        Particle(i) = z_update(find(rand <= cumsum(w),1));   % 粒子权重大的将多得到后代    
    end   
    
    %状态估计,重采样以后,每个粒子的权重都变成了1/N 
    z_estimate(t)=mean(Particle);
    
end


%绘图
figure;
plot(1:T,z_real,'.-b', 1:T, z_estimate, '-.r','linewidth',3)
xlabel('time step'); ylabel('flight position');    
legend('真实值', '粒子估算值');  

在这里插入图片描述

总结

在经济学领域,粒子滤波被应用在经济数据预测;在军事领域已经被应用于雷达跟踪空中飞行物,空对空、空对地的被动式跟踪;在自动驾驶中,它被应用于目标检测;交通管制领域它被应用在对车或人视频监控;它还用于机器人的全局定位。引用自:百度百科

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值