1. 符号说明
- x k x_{k} xk表示 k k k时刻目标的状态
- z k z_{k} zk表示 k k k时刻目标的观测状态
- X k = { x 0 , x 1 , . . . , x k } X_{k}=\{x_0,x_1,...,x_k\} Xk={x0,x1,...,xk}表示从初始 0 0 0时刻到 k k k时刻目标的状态的集合
- Z k = { z 1 , z 2 , . . . , z k } Z_{k}=\{z_1,z_2,...,z_k\} Zk={z1,z2,...,zk}表示从 1 1 1时刻到 k k k时刻目标的观测状态的集合
2. 贝叶斯框架
假设已知目标状态的先验信息,即
p
(
x
0
)
=
p
(
x
0
∣
z
0
)
p(x_0)=p(x_0|z_0)
p(x0)=p(x0∣z0)已知(
z
0
z_0
z0表示没有观测)。再假设目标的状态转移服从一阶马尔可夫链模型,即
x
k
x_k
xk只依赖于
x
k
−
1
x_{k-1}
xk−1。并且已知目标的状态转移概率密度函数为
p
(
x
k
∣
x
k
−
1
)
p(x_k|x_{k-1})
p(xk∣xk−1),该函数由目标的动态模型决定。比如,在线性高斯的情况下,有:
x
k
=
F
x
k
−
1
+
v
k
−
1
x_k=Fx_{k-1}+v_{k-1}
xk=Fxk−1+vk−1
其中,
v
k
−
1
∼
N
(
0
,
Q
k
−
1
)
,
v_{k-1}\sim N(0,Q_{k-1}),
vk−1∼N(0,Qk−1),那么状态转移概率密度函数为:
p
(
x
k
∣
x
k
−
1
)
=
N
(
x
k
;
F
x
k
−
1
,
Q
k
−
1
)
p(x_k|x_{k-1})=N(x_k;Fx_{k-1},Q_{k-1})
p(xk∣xk−1)=N(xk;Fxk−1,Qk−1)
似然函数
p
(
z
k
∣
x
k
)
p(z_k|x_k)
p(zk∣xk)由目标的观测模型决定。比如,在线性高斯的情况下,有:
z
k
=
H
x
k
+
w
k
z_k=Hx_k+w_k
zk=Hxk+wk
其中,
w
k
∼
N
(
0
,
R
k
)
w_k\sim N(0,R_k)
wk∼N(0,Rk),那么似然函数为:
p
(
z
k
∣
x
k
)
=
N
(
z
k
;
H
x
k
,
R
k
)
p(z_k|x_k)=N(z_k;Hx_k,R_k)
p(zk∣xk)=N(zk;Hxk,Rk)
贝叶斯框架可分为两步,即预测和更新。
2.1 预测
假设我们已经知道了上一时刻的后验概率密度函数
p
(
x
k
−
1
∣
Z
k
−
1
)
p(x_{k-1}|Z_{k-1})
p(xk−1∣Zk−1)(
k
k
k最小为1,当
k
=
1
k=1
k=1时,那么后验概率密度函数
p
(
x
0
∣
z
0
)
p(x_0|z_0)
p(x0∣z0)就变成了关于目标状态的先验信息
p
(
x
0
)
p(x_0)
p(x0)了)。那么预测步为:
p
(
x
k
∣
Z
k
−
1
)
=
∫
−
∞
+
∞
p
(
x
k
∣
x
k
−
1
)
p
(
x
k
−
1
∣
Z
k
−
1
)
d
x
k
−
1
p(x_k|Z_{k-1})=\int _{-\infty}^{+\infty}p(x_k|x_{k-1})p(x_{k-1}|Z_{k-1})dx_{k-1}
p(xk∣Zk−1)=∫−∞+∞p(xk∣xk−1)p(xk−1∣Zk−1)dxk−1
证明(不想看数学证明可以略过):
因为
p
(
x
k
,
x
k
−
1
∣
Z
k
−
1
)
=
p
(
x
k
,
x
k
−
1
,
Z
k
−
1
)
p
(
Z
k
−
1
)
=
p
(
x
k
∣
x
k
−
1
,
Z
k
−
1
)
p
(
x
k
−
1
∣
Z
k
−
1
)
p
(
Z
k
−
1
)
p
(
Z
k
−
1
)
=
p
(
x
k
∣
x
k
−
1
,
Z
k
−
1
)
p
(
x
k
−
1
∣
Z
k
−
1
)
\begin{aligned} p(x_k,x_{k-1}|Z_{k-1})&=\dfrac{p(x_k,x_{k-1},Z_{k-1})}{p(Z_{k-1})}\\ &=\dfrac{p(x_k|x_{k-1},Z_{k-1})p(x_{k-1}|Z_{k-1})p(Z_{k-1})}{p(Z_{k-1})}\\ &=p(x_k|x_{k-1},Z_{k-1})p(x_{k-1}|Z_{k-1}) \end{aligned}
p(xk,xk−1∣Zk−1)=p(Zk−1)p(xk,xk−1,Zk−1)=p(Zk−1)p(xk∣xk−1,Zk−1)p(xk−1∣Zk−1)p(Zk−1)=p(xk∣xk−1,Zk−1)p(xk−1∣Zk−1)
而目标状态服从一阶马尔可夫链模型,所以有:给定
x
k
−
1
x_{k-1}
xk−1,
x
k
x_k
xk条件独立于
Z
k
−
1
Z_{k-1}
Zk−1,即:
p
(
x
k
∣
x
k
−
1
,
Z
k
−
1
)
=
p
(
x
k
∣
x
k
−
1
)
p(x_k|x_{k-1},Z_{k-1})=p(x_k|x_{k-1})
p(xk∣xk−1,Zk−1)=p(xk∣xk−1)
所以
p
(
x
k
,
x
k
−
1
∣
Z
k
−
1
)
=
p
(
x
k
∣
x
k
−
1
)
p
(
x
k
−
1
∣
Z
k
−
1
)
p(x_k,x_{k-1}|Z_{k-1})=p(x_k|x_{k-1})p(x_{k-1}|Z_{k-1})
p(xk,xk−1∣Zk−1)=p(xk∣xk−1)p(xk−1∣Zk−1)
最后有
p
(
x
k
∣
Z
k
−
1
)
=
∫
−
∞
+
∞
p
(
x
k
,
x
k
−
1
∣
Z
k
−
1
)
d
x
k
−
1
p(x_k|Z_{k-1})=\int _{-\infty}^{+\infty}p(x_k,x_{k-1}|Z_{k-1})dx_{k-1}
p(xk∣Zk−1)=∫−∞+∞p(xk,xk−1∣Zk−1)dxk−1
得证。
2.2 更新
更新步为:
p
(
x
k
∣
Z
k
)
=
p
(
z
k
∣
x
k
)
p
(
x
k
∣
Z
k
−
1
)
p
(
z
k
∣
Z
k
−
1
)
p(x_k|Z_k)=\dfrac{p(z_k|x_k)p(x_k|Z_{k-1})}{p(z_k|Z_{k-1})}
p(xk∣Zk)=p(zk∣Zk−1)p(zk∣xk)p(xk∣Zk−1)
其中,
p
(
z
k
∣
Z
k
−
1
)
=
∫
−
∞
+
∞
p
(
z
k
∣
x
k
)
p
(
x
k
∣
Z
k
−
1
)
d
x
k
p(z_k|Z_{k-1})=\int _{-\infty}^{+\infty}p(z_k|x_k)p(x_k|Z_{k-1})dx_k
p(zk∣Zk−1)=∫−∞+∞p(zk∣xk)p(xk∣Zk−1)dxk
证明(不想看数学证明可以略过):
因为
p
(
x
k
∣
Z
k
)
=
p
(
x
k
∣
z
k
,
Z
k
−
1
)
=
p
(
x
k
,
z
k
,
Z
k
−
1
)
p
(
z
k
,
Z
k
−
1
)
=
p
(
z
k
∣
x
k
,
Z
k
−
1
)
p
(
x
k
∣
Z
k
−
1
)
p
(
Z
k
−
1
)
p
(
z
k
∣
Z
k
−
1
)
p
(
Z
k
−
1
)
=
p
(
z
k
∣
x
k
,
Z
k
−
1
)
p
(
x
k
∣
Z
k
−
1
)
p
(
z
k
∣
Z
k
−
1
)
\begin{aligned} p(x_k|Z_k)&=p(x_k|z_k,Z_{k-1})\\ &=\dfrac{p(x_k,z_k,Z_{k-1})}{p(z_k,Z_{k-1})}\\ &=\dfrac{p(z_k|x_k,Z_{k-1})p(x_k|Z_{k-1})p(Z_{k-1})}{p(z_k|Z_{k-1})p(Z_{k-1})}\\ &=\dfrac{p(z_k|x_k,Z_{k-1})p(x_k|Z_{k-1})}{p(z_k|Z_{k-1})}\\ \end{aligned}
p(xk∣Zk)=p(xk∣zk,Zk−1)=p(zk,Zk−1)p(xk,zk,Zk−1)=p(zk∣Zk−1)p(Zk−1)p(zk∣xk,Zk−1)p(xk∣Zk−1)p(Zk−1)=p(zk∣Zk−1)p(zk∣xk,Zk−1)p(xk∣Zk−1)
而帧与帧之间的测量是独立的,即给定
x
k
x_k
xk,
z
k
z_k
zk条件独立于
Z
k
−
1
Z_{k-1}
Zk−1,所以有:
p
(
z
k
∣
x
k
,
Z
k
−
1
)
=
p
(
z
k
∣
x
k
)
p(z_k|x_k,Z_{k-1})=p(z_k|x_k)
p(zk∣xk,Zk−1)=p(zk∣xk)
所以得:
p
(
x
k
∣
Z
k
)
=
p
(
z
k
∣
x
k
)
p
(
x
k
∣
Z
k
−
1
)
p
(
z
k
∣
Z
k
−
1
)
p(x_k|Z_k)=\dfrac{p(z_k|x_k)p(x_k|Z_{k-1})}{p(z_k|Z_{k-1})}
p(xk∣Zk)=p(zk∣Zk−1)p(zk∣xk)p(xk∣Zk−1)
对于分母的证明,有:
p
(
z
k
,
x
k
∣
Z
k
−
1
)
=
p
(
z
k
,
x
k
,
Z
k
−
1
)
p
(
Z
k
−
1
)
=
p
(
z
k
∣
x
k
,
Z
k
−
1
)
p
(
x
k
∣
Z
k
−
1
)
p
(
Z
k
−
1
)
p
(
Z
k
−
1
)
=
p
(
z
k
∣
x
k
)
p
(
x
k
∣
Z
k
−
1
)
\begin{aligned} p(z_k,x_k|Z_{k-1})&=\dfrac{p(z_k,x_k,Z_{k-1})}{p(Z_{k-1})}\\ &=\dfrac{p(z_k|x_k,Z_{k-1})p(x_k|Z_{k-1})p(Z_{k-1})}{p(Z_{k-1})}\\ &=p(z_k|x_k)p(x_k|Z_{k-1}) \end{aligned}
p(zk,xk∣Zk−1)=p(Zk−1)p(zk,xk,Zk−1)=p(Zk−1)p(zk∣xk,Zk−1)p(xk∣Zk−1)p(Zk−1)=p(zk∣xk)p(xk∣Zk−1)
然后对上式边缘化,就有:
p
(
z
k
∣
Z
k
−
1
)
=
∫
−
∞
+
∞
p
(
z
k
,
x
k
∣
Z
k
−
1
)
d
x
k
p(z_k|Z_{k-1})=\int _{-\infty}^{+\infty}p(z_k,x_k|Z_{k-1})dx_k
p(zk∣Zk−1)=∫−∞+∞p(zk,xk∣Zk−1)dxk