前言:上一篇文章的最后我们提到卡尔曼滤波存在着一个非常大的局限性——它仅能对线性的处理模型和测量模型进行精确的估计,在非线性的场景中并不能达到最优的估计效果。所以之前为了保证我们的处理模型是线性的,我们上一节中使用了恒定速度模型,然后将估计目标的加减速用处理噪声来表示,这一模型用来估算行人的状态其实已经足够了,但是在现实的驾驶环境中,我们不仅要估计行人,我们除了估计行人状态以外,我们还需要估计其他车辆,自行车等等状态,他们的状态估计显然不能使用简单的线性系统来描述,这里,我们介绍非线性系统情况下的一种广泛使用的滤波算法——扩展卡尔曼滤波(Extended Kalman Filter, EKF)。
本节主要讲解非线性系统中广泛使用的扩展卡尔曼滤波算法,我们通常将该算法应用于实际的车辆状态估计(或者说车辆追踪)中。另外,实际的车辆追踪运动模型显然不能使用简单的恒定速度模型来建模,在本节中会介绍几种应用于车辆追踪的高级运动模型。并且已经其中的CTRV模型来构造我们的扩展卡尔曼滤波。最后,在代码实例中,我会介绍如何使用EKF做多传感器融合。
编写不易,转载请附来源:http://blog.csdn.net/adamshan/article/details/78265754
应用于车辆追踪的高级运动模型
首先要明确的一点是,不管是什么运动模型,本质上都是为了帮助我们简化问题,所以我们可以根据运动模型的复杂程度(次数)来给我们常用的运动模型分一下类。
一次运动模型(也别称为线性运动模型):
- 恒定速度模型(Constant Velocity, CV)
- 恒定加速度模型(Constant Acceleration, CA)
这些线性运动模型假定目标是直线运动的,并不考虑物体的转弯。
二次运动模型:
- 恒定转率和速度模型(Constant Turn Rate and Velocity,CTRV)
- 恒定转率和加速度模型(Constant Turn Rate and Acceleration,CTRA)
CTRV目前多用于机载追踪系统(飞机),这些二次运动模型大多假定速度 v v v 和 偏航角速度(yaw rate) ω \omega ω 没有关系,因此,在这类运动模型中,由于偏航角速度测量的扰动(不稳定),即使车辆没有移动,我们的运动模型下的角速度也会发生细微的变化。
为了解决这个问题,速度 v v v 和 偏航角速度 ω \omega ω 的关联可以通过设定转向角 Φ \Phi Φ 恒定来建立,这样就引出了 恒定转向角和速度模型(Constant Steering Angle and Velocity,CSAV), 另外,速度可以别假定为线性变化的,进而引出了常曲率和加速度模型(Constant Curvature and Acceleration,CCA)。
这些运动模型的关系如图:
运动模型的状态转移公式
由于除CCA以外,以上的运动模型都非常著名,故本文不提供详细的推导过程。本文提供CV和CTRV模型的状态转移公式。
状态转移公式:就是我们的处理模型由上一状态的估计计算下一个状态的先验分布的计算公式,可以理解为我们基于一定的先验知识总结出来的运动公式。
-
CV模型:
CV模型的状态空间可以表示为:
x → ( t ) = ( x y v x v y ) T \overrightarrow{x}(t) = (x \quad y \quad v_x \quad v_y)^T x(t)=(xyvxvy)T
那么转移函数为:
x → ( t + Δ t ) = ( x ( t ) + Δ t v x y ( t ) + Δ t v y v x v y ) \overrightarrow{x}(t+\Delta t) = \left( \begin{array}{c} x(t) + \Delta t v_x \\ y(t) + \Delta t v_y \\ v_x \\ v_y \end{array} \right) x(t+Δt)=⎝⎜⎜⎛x(t)+Δtvxy(t)+Δtvyvxvy⎠⎟⎟⎞ -
CTRV模型:
在CTRV中,目标的状态量为:
x → ( t ) = ( x y v θ ω ) T \overrightarrow{x}(t) = (x \quad y \quad v \quad \theta \quad \omega)^T x(t)=(xyvθω)T
其中, θ \theta θ 为偏航角,是追踪的目标车辆在当前车辆坐标系下与x轴的夹角,逆时针方向为正,取值范围是[ 0 0 0, 2 π 2\pi 2π), ω \omega ω是偏航角速度。CTRV的状态转移函数为:
x → ( t + Δ t ) = ( v ω sin ( ω Δ t + θ ) − v ω sin ( θ ) + x ( t ) − v ω cos ( ω Δ t + θ ) + v ω cos ( θ ) + y ( t ) v ω Δ t + θ ω ) \overrightarrow{x}(t+\Delta t) = \left( \begin{array}{c} \frac{v}{\omega} \sin(\omega \Delta t + \theta) - \frac{v}{\omega}\sin(\theta) + x(t) \\ -\frac{v}{\omega} \cos(\omega \Delta t + \theta) + \frac{v}{\omega}\cos(\theta) + y(t) \\ v \\ \omega \Delta t + \theta \\ \omega \end{array} \right) x(t+Δt)=⎝⎜⎜⎜⎜⎛ωvsin(ωΔt+θ)−ωvsin(θ)+x(t)−ωvcos(ωΔt+θ)+ωvcos(θ)+y(t)vωΔt+θω⎠⎟⎟⎟⎟⎞
本文下面的内容将以CTRV模型作为我们的运动模型。使用CTRV还存在一个问题,那就是
ω
=
0
\omega = 0
ω=0 的情况,此时我们的状态转移函数公式中的
(
x
,
y
)
(x, y)
(x,y) 将变成无穷大。为了解决这个问题,我们考察一下
ω
=
0
\omega = 0
ω=0 的情况,此时我们追踪的车辆实际上是直线行驶的,所以我们的
(
x
,
y
)
(x, y)
(x,y) 的计算公式就变成了:
x
(
t
+
Δ
t
)
=
v
cos
(
θ
)
Δ
t
+
x
(
t
)
x(t+\Delta t) = v \cos(\theta)\Delta t + x(t)
x(t+Δt)=vcos(θ)Δt+x(t)
y
(
t
+
Δ
t
)
=
v
sin
(
θ
)
Δ
t
+
y
(
t
)
y(t+\Delta t) = v \sin(\theta)\Delta t + y(t)
y(t+Δt)=vsin(θ)Δt+y(t)
那么现在问题来了,我们知道,卡尔曼滤波仅仅用于处理线性问题,那么很显然我们现在的处理模型是非线性的,这个时候我们就不能简单使用卡尔曼滤波进行预测和更新了,此时预测的第一步变成了如下非线性函数:
x
k
+
1
=
g
(
x
k
,
u
)
x_{k+1} = g(x_k, u)
xk+1=g(xk,u)
其中,
g
(
)
g()
g() 表示CTRV运动模型的状态转移函数,
u
u
u 表示处理噪声。为了解决非线性系统下的问题,我们引入扩展卡尔曼滤波(Extended Kalman Filter,EKF)
扩展卡尔曼滤波
雅可比矩阵
扩展卡尔曼滤波使用线性变换来近似非线性线性变换,具体来说,EKF使用一阶泰勒展式来进行线性化:
h
(
x
)
≈
h
(
u
)
+
∂
h
(
u
)
∂
x
(
x
−
u
)
h(x) \approx h(u) + \frac{\partial h(u)}{\partial x} (x-u)
h(x)≈h(u)+∂x∂h(u)(x−u)
数学中,泰勒公式是一个用函数在某点的信息描述其附近取值的公式。如果函数足够平滑的话,在已知函数在某一点的各阶导数值的情况之下,泰勒公式可以用这些导数值做系数构建一个多项式来近似函数在这一点的邻域中的值。泰勒公式还给出了这个多项式和实际的函数值之间的偏差。
回到我们的处理模型中,我们的状态转移函数为:
x
→
(
t
+
Δ
t
)
=
g
(
x
(
t
)
)
=
(
v
ω
sin
(
ω
Δ
t
+
θ
)
−
v
ω
sin
(
θ
)
+
x
(
t
)
−
v
ω
cos
(
ω
Δ
t
+
θ
)
+
v
ω
cos
(
θ
)
+
y
(
t
)
v
ω
Δ
t
+
θ
ω
)
,
ω
≠
0
\overrightarrow{x}(t+\Delta t) = g(x(t)) = \left( \begin{array}{c} \frac{v}{\omega} \sin(\omega \Delta t + \theta) - \frac{v}{\omega}\sin(\theta) + x(t) \\ -\frac{v}{\omega} \cos(\omega \Delta t + \theta) + \frac{v}{\omega}\cos(\theta) + y(t) \\ v \\ \omega \Delta t + \theta \\ \omega \end{array} \right) , \quad \omega \neq 0
x(t+Δt)=g(x(t))=⎝⎜⎜⎜⎜⎛ωvsin(ωΔt+θ)−ωvsin(θ)+x(t)−ωvcos(ωΔt+θ)+ωvcos(θ)+y(t)vωΔt+θω⎠⎟⎟⎟⎟⎞,ω=0
x → ( t + Δ t ) = g ( x ( t ) ) = ( v cos ( θ ) Δ t + x ( t ) v sin ( θ ) Δ t + y ( t ) v ω Δ t + θ ω ) , ω = 0 \overrightarrow{x}(t+\Delta t) = g(x(t)) = \left( \begin{array}{c} v \cos(\theta)\Delta t + x(t)\\ v \sin(\theta)\Delta t + y(t) \\ v \\ \omega \Delta t + \theta \\ \omega \end{array} \right) , \quad \omega = 0 x(t+Δt)=g(x(t))=⎝⎜⎜⎜⎜⎛vcos(θ)Δt+x(t)vsin(θ)Δt+y(t)vωΔt+θω⎠⎟⎟⎟⎟⎞,ω=0
那么,对于这个多元函数,我们需要使用多元泰勒级数:
T
(
x
)
=
f
(
u
)
+
(
x
−
u
)
D
f
(
u
)
+
1
2
!
(
x
−
u
)
2
D
2
f
(
u
)
+
.
.
.
T(x) = f(u) + (x - u)Df(u) + \frac{1}{2!}(x-u)^2D^2f(u) + ...
T(x)=f(u)+(x−u)Df(u)+2!1(x−u)2D2f(u)+...
其中,
D
f
(
a
)
Df(a)
Df(a)叫雅可比矩阵,它是多元函数中各个因变量关于各个自变量的一阶偏导数构成的矩阵。
在向量微积分中,雅可比矩阵是一阶偏导数以一定方式排列成的矩阵,其行列式称为雅可比行列式。雅可比矩阵的重要性在于它体现了一个可微方程与给出点的最优线性逼近。因此,雅可比矩阵类似于多元函数的导数。
在扩展卡尔曼滤波中,由于 ( x − u ) (x-u) (x−u) 本身数值很小,那么 ( x − u ) (x-u) (x−u) 就更小了,所以更高阶的级数在此问题中忽略不计,我们只考虑到利用雅可比矩阵进行线性化。
那么接下来就是求解雅可比矩阵,在CTRV模型中,对各个元素求偏导数可以得到雅可比矩阵( ω ≠ 0 \omega \neq 0 ω=0):
J A = [ 1 0 1 ω ( − sin ( θ ) + sin ( Δ t ω + θ ) ) v ω ( − cos ( θ ) + cos ( Δ t ω + θ ) ) Δ t v ω cos ( Δ t ω + θ ) − v ω 2 ( − sin ( θ ) + sin ( Δ t ω + θ ) ) 0 1 v ω ( − sin ( θ ) + sin ( Δ t ω + θ ) ) 1 ω ( cos ( θ ) − cos ( Δ t ω + θ ) ) Δ t v ω sin ( Δ t ω + θ ) − v ω 2 ( cos ( θ ) − cos ( Δ t ω + θ ) ) 0 0 1 0 0 0 0 0 1 Δ t 0 0 0 0 1 ] J_A = \left[\begin{matrix}1 & 0 & \frac{1}{\omega} \left(- \sin{\left (\theta \right )} + \sin{\left (\Delta t \omega + \theta \right )}\right) & \frac{v}{\omega} \left(- \cos{\left (\theta \right )} + \cos{\left (\Delta t \omega + \theta \right )}\right) & \frac{\Delta t v}{\omega} \cos{\left (\Delta t \omega + \theta \right )} - \frac{v}{\omega^{2}} \left(- \sin{\left (\theta \right )} + \sin{\left (\Delta t \omega + \theta \right )}\right)\\0 & 1 & \frac{v}{\omega} \left(- \sin{\left (\theta \right )} + \sin{\left (\Delta t \omega + \theta \right )}\right) & \frac{1}{\omega} \left(\cos{\left (\theta \right )} - \cos{\left (\Delta t \omega + \theta \right )}\right) & \frac{\Delta t v}{\omega} \sin{\left (\Delta t \omega + \theta \right )} - \frac{v}{\omega^{2}} \left(\cos{\left (\theta \right )} - \cos{\left (\Delta t \omega + \theta \right )}\right)\\0 & 0 & 1 & 0 & 0\\0 & 0 & 0 & 1 & \Delta t \\0 & 0 & 0 & 0 & 1\end{matrix}\right] JA=⎣⎢⎢⎢⎢⎡1000001000ω1(−sin(θ)+sin(Δtω+θ))ωv(−sin(θ)+sin(Δtω+θ))100ωv(−cos(θ)+cos(Δtω+θ))ω1(cos(θ)−cos(Δtω+θ))010ωΔtvcos(Δtω+θ)−ω2v(−sin(θ)+sin(Δtω+θ))ωΔtvsin(Δtω+θ)−ω2v(cos(θ)−cos(Δtω+θ))0Δt1⎦⎥⎥⎥⎥⎤
当 ω = 0 \omega = 0 ω=0 时,雅可比矩阵为:
J A = [ 1 0 Δ t cos ( θ ) − Δ t v sin ( θ ) 0 0 1 Δ t sin ( θ ) Δ t v cos ( θ ) 0 0 0 1 0 0 0 0 0 1 Δ t 0 0 0 0 1 ] J_A = \left[\begin{matrix}1 & 0 & \Delta t \cos{\left (\theta \right )} & - \Delta t v \sin{\left (\theta \right )} & 0\\0 & 1 & \Delta t \sin{\left (\theta \right )} & \Delta t v \cos{\left (\theta \right )} & 0\\0 & 0 & 1 & 0 & 0\\0 & 0 & 0 & 1 & \Delta t\\0 & 0 & 0 & 0 & 1\end{matrix}\right] JA=⎣⎢⎢⎢⎢⎡1000001000Δtcos(θ)Δtsin(θ)100−Δtvsin(θ)Δtvcos(θ)010000Δt1⎦⎥⎥⎥⎥⎤
在我们后面的Python实现中,我们将使用numdifftools包直接计算雅可比矩阵,而不需要我们使用代码写这个雅可比矩阵。在得到我们CTRV模型的雅可比矩阵以后,我们的处理模型就可以写成:
x
k
+
1
=
g
(
x
k
,
u
)
x_{k+1} = g(x_k, u)
xk+1=g(xk,u)
P
k
+
1
=
J
A
P
k
J
A
T
+
Q
P_{k+1} = J_AP_kJ_A^T + Q
Pk+1=JAPkJAT+Q
处理噪声
处理噪声模拟了运动模型中的扰动,我们引入运动模型的出发点就是要简化我们要处理的问题,这个简化是建立在多个假设的基础上(在CTRV中,这些假设就是恒定偏航角速度和速度),但是在现实问题中这些假设就会带来一定的误差,处理噪声实际上描述了当我们的系统在运行一个指定时间段以后可能面临多大的这样的误差。在CTRV模型中噪声的引入主要来源于两处:直线加速度和偏航角加速度噪声,我们假定直线加速度和偏航角加速度满足均值为
0
0
0,方差分别为
σ
a
2
\sigma_a^2
σa2,
σ
ω
˙
2
\sigma_{\dot\omega}^2
σω˙2 的高斯分布,由于均值为
0
0
0, 我们在状态转移公式中的
u
u
u就可以不予考虑,我们来看噪声带来的不确定性
Q
Q
Q,直线加速度和偏航角加速度将影响我们的状态量
(
x
,
y
,
v
,
θ
,
ω
)
(x,y,v,\theta,\omega)
(x,y,v,θ,ω),这两个加速度量对我们的状态的影响的表达式如下:
n
o
i
s
e
_
t
e
r
m
=
[
1
2
Δ
t
2
μ
a
cos
(
θ
)
1
2
Δ
t
2
μ
a
sin
(
θ
)
Δ
t
μ
a
1
2
Δ
t
2
μ
ω
˙
Δ
t
μ
ω
˙
]
noise\_term = \left[ \begin{array}{c} \frac{1}{2} \Delta t^2 \mu_a \cos(\theta) \\ \frac{1}{2} \Delta t^2 \mu_a \sin(\theta) \\ \Delta t \mu_a \\ \frac{1}{2} \Delta t^2 \mu_{\dot\omega} \\ \Delta t\mu_{\dot\omega} \end{array} \right]
noise_term=⎣⎢⎢⎢⎢⎡21Δt2μacos(θ)21Δt2μasin(θ)Δtμa21Δt2μω˙Δtμω˙⎦⎥⎥⎥⎥⎤
其中 μ a , μ ω ˙ \mu_a, \mu_{\dot\omega} μa,μω˙ 为直线上和转角上的加速度(在这个模型中,我们把把它们看作处理噪声),我们分解这个矩阵:
n o i s e _ t e r m = [ 1 2 Δ t 2 cos ( θ ) 0 1 2 Δ t 2 sin ( θ ) 0 Δ t 0 0 1 2 Δ t 2 0 Δ t ] ⋅ [ μ a μ ω ˙ ] = G ⋅ μ noise\_term = \left[ \begin{array}{c} \frac{1}{2} \Delta t^2 \cos(\theta) & 0 \\ \frac{1}{2} \Delta t^2 \sin(\theta) & 0 \\ \Delta t & 0 \\ 0 & \frac{1}{2} \Delta t^2 \\ 0 & \Delta t \end{array} \right] \cdot \left[ \begin{array}{c} \mu_a \\ \mu_{\dot\omega} \end{array} \right] = G \cdot \mu noise_term=⎣⎢⎢⎢⎢⎡21Δt2cos(θ)21Δt2sin(θ)Δt0000021Δt2Δt⎦⎥⎥⎥⎥⎤⋅[μaμω˙]=G⋅μ
我们知道
Q
Q
Q 就是处理噪声的协方差矩阵,其表达式为:
Q
=
E
[
n
o
i
s
e
_
t
e
r
m
⋅
n
o
i
s
e
_
t
e
r
m
T
]
=
E
[
G
μ
μ
T
G
T
]
=
G
⋅
E
[
μ
μ
T
]
⋅
G
T
Q = E [noise\_term \cdot noise\_term^T] = E[G \mu \mu^T G^T] = G \cdot E[\mu \mu^T] \cdot G^T
Q=E[noise_term⋅noise_termT]=E[GμμTGT]=G⋅E[μμT]⋅GT
其中:
E
[
μ
μ
T
]
=
(
σ
a
2
0
0
σ
ω
˙
2
)
E[\mu \mu^T] = \left( \begin{array}{c} \sigma_a^2 & 0 \\ 0 & \sigma_{\dot\omega}^2\end{array} \right)
E[μμT]=(σa200σω˙2)
所以,我们在CTRV模型中的处理噪声的协方差矩阵
Q
Q
Q 的计算公式就是:
Q
=
[
(
1
2
Δ
t
2
σ
a
cos
(
θ
)
)
2
1
4
Δ
t
4
σ
a
2
sin
(
θ
)
cos
(
θ
)
1
2
Δ
t
3
σ
a
2
cos
(
θ
)
0
0
1
4
Δ
t
4
σ
a
2
sin
(
θ
)
cos
(
θ
)
(
1
2
Δ
t
2
σ
a
sin
(
θ
)
)
2
1
2
Δ
t
3
σ
a
2
sin
(
θ
)
0
0
1
2
Δ
t
3
σ
a
2
cos
(
θ
)
1
2
Δ
t
3
σ
a
2
sin
(
θ
)
Δ
t
2
σ
a
2
0
0
0
0
0
(
1
2
Δ
t
2
σ
ω
˙
)
2
1
2
Δ
t
3
σ
ω
˙
2
0
0
0
1
2
Δ
t
3
σ
ω
˙
Δ
t
2
σ
ω
˙
]
Q = \left[ \begin{array}{c} (\frac{1}{2} \Delta t^2 \sigma_a \cos(\theta))^2 & \frac{1}{4} \Delta t^4 \sigma_a^2 \sin(\theta) \cos(\theta) & \frac{1}{2} \Delta t^3 \sigma_a^2 \cos(\theta) & 0 & 0 \\ \frac{1}{4} \Delta t^4 \sigma_a^2 \sin(\theta) \cos(\theta) & (\frac{1}{2} \Delta t^2 \sigma_a \sin(\theta))^2 & \frac{1}{2} \Delta t^3 \sigma_a^2 \sin(\theta) & 0 & 0 \\ \frac{1}{2} \Delta t^3 \sigma_a^2 \cos(\theta) & \frac{1}{2} \Delta t^3 \sigma_a^2 \sin(\theta) & \Delta t^2 \sigma_a^2 & 0 & 0 \\ 0 & 0 & 0 & (\frac{1}{2} \Delta t^2 \sigma_{\dot\omega})^2 & \frac{1}{2} \Delta t^3 \sigma_{\dot\omega}^2 \\ 0 & 0 & 0 & \frac{1}{2} \Delta t^3 \sigma_{\dot\omega} & \Delta t^2 \sigma_{\dot\omega} \end{array} \right]
Q=⎣⎢⎢⎢⎢⎡(21Δt2σacos(θ))241Δt4σa2sin(θ)cos(θ)21Δt3σa2cos(θ)0041Δt4σa2sin(θ)cos(θ)(21Δt2σasin(θ))221Δt3σa2sin(θ)0021Δt3σa2cos(θ)21Δt3σa2sin(θ)Δt2σa200000(21Δt2σω˙)221Δt3σω˙00021Δt3σω˙2Δt2σω˙⎦⎥⎥⎥⎥⎤
测量
假设我们有激光雷达和雷达两个传感器,它们分别以一定的频率来测量如下数据:
- 激光雷达:测量目标车辆的坐标 ( x , y ) (x,y) (x,y) 。这里的x,y是相对于我们的车辆的坐标系的,即我们的车辆为坐标系的原点,我们的车头为x轴,车的左侧为y轴。
- 雷达:测量目标车辆在我们车辆坐标系下与本车的距离 ρ \rho ρ,目标车辆与x轴的夹角 ψ \psi ψ,以及目标车辆与我们自己的相对距离变化率 ρ ˙ \dot\rho ρ˙(本质上就是目标车辆的实际速度在我们和目标车辆的连线上的分量)
前面的卡尔曼滤波器中,我们使用一个测量矩阵 H H H 将预测的结果映射到测量空间,那是因为这个映射本身就是线性的,现在,我们使用雷达和激光雷达来测量目标车辆(我们把这个过程称为传感器融合),这个时候会有两种情况,即:
-
激光雷达的测量模型仍然是线性的,其测量矩阵为:
H L = [ 1 0 0 0 0 0 1 0 0 0 ] H_L = \left[ \begin{array}{c} 1 & 0 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 & 0 \end{array} \right] HL=[1001000000]
将预测映射到激光雷达测量空间: H L x → = ( x , y ) T H_L\overrightarrow{x} = (x, y)^T HLx=(x,y)T -
雷达的预测映射到测量空间是非线性的,其表达式为:
( ρ ψ ρ ˙ ) = ( x 2 + y 2 a t a n 2 ( y , x ) v x + v y x 2 + y 2 ) \left(\begin{matrix} \rho \\ \psi \\ \dot\rho \end{matrix}\right) = \left(\begin{matrix}\sqrt{x^{2} + y^{2}}\\\operatorname{atan_{2}}{\left (y,x \right )}\\\frac{v x + v y}{\sqrt{x^{2} + y^{2}}}\end{matrix}\right) ⎝⎛ρψρ˙⎠⎞=⎝⎜⎛x2+y2atan2(y,x)x2+y2vx+vy⎠⎟⎞
此时我们使用 h ( x ) h(x) h(x) 来表示这样一个非线性映射,那么在求解卡尔曼增益时我们也要将该非线性过程使用泰勒公式将其线性化,参照预测过程,我们也只要求解 h ( x ) h(x) h(x)的雅可比矩阵:
J H = [ x x 2 + y 2 y x 2 + y 2 0 0 0 − y x 2 + y 2 x x 2 + y 2 0 0 0 v x 2 + y 2 − x ( v x + v y ) ( x 2 + y 2 ) 3 2 v x 2 + y 2 − y ( v x + v y ) ( x 2 + y 2 ) 3 2 x + y x 2 + y 2 0 0 ] J_H = \left[\begin{matrix}\frac{x}{\sqrt{x^{2} + y^{2}}} & \frac{y}{\sqrt{x^{2} + y^{2}}} & 0 & 0 & 0\\- \frac{y}{x^{2} + y^{2}} & \frac{x}{x^{2} + y^{2}} & 0 & 0 & 0\\\frac{v}{\sqrt{x^{2} + y^{2}}} - \frac{x \left(v x + v y\right)}{\left(x^{2} + y^{2}\right)^{\frac{3}{2}}} & \frac{v}{\sqrt{x^{2} + y^{2}}} - \frac{y \left(v x + v y\right)}{\left(x^{2} + y^{2}\right)^{\frac{3}{2}}} & \frac{x + y}{\sqrt{x^{2} + y^{2}}} & 0 & 0\end{matrix}\right] JH=⎣⎢⎢⎡x2+y2x−x2+y2yx2+y2v−(x2+y2)23x(vx+vy)x2+y2yx2+y2xx2+y2v−(x2+y2)23y(vx+vy)00x2+y2x+y000000⎦⎥⎥⎤
虽然这个雅可比矩阵看似非常复杂,但是我们待会编程的时候并不需要完整的推导出这个雅可比矩阵的表达式,在本篇中,我们采用numdifftools这个公式来直接求解雅可比矩阵。
综上,EKF的整个过程为:
Python实现
和之前一样,为了实现交互式的代码,实例的代码为了便于理解,我们仍然使用大家熟悉的Python来实现,当然,实际无人车项目肯定是需要用C++来实现的,要将下面的示例代码使用C++来改写是非常简单快速的。
首先引入相关的库:
from __future__ import print_function
import numpy as np
import matplotlib.dates as mdates
import matplotlib.pyplot as plt
from scipy.stats import norm
from sympy import Symbol, symbols, Matrix, sin, cos, sqrt, atan2
from sympy import init_printing
init_printing(use_latex=True)
import numdifftools as nd
import math
首先我们读取我们的数据集,该数据集包含了追踪目标的LIDAR和RADAR的测量值,以及测量的时间点,同时为了验证我们追踪目标的精度,该数据还包含了追踪目标的真实坐标。(数据下载链接见文章末尾)
其中第一列表示测量数据来自LIDAR还是RADAR,LIDAR的2,3列表示测量的目标 ( x , y ) (x,y) (x,y),第4列表示测量的时间点,第5,6,7,8表示真实的 ( x , y , v x , v y ) (x, y, v_x, v_y) (x,y,vx,vy), RADAR测量的(前三列)是 ( ρ , ψ , ρ ˙ ) (\rho, \psi, \dot\rho) (ρ,ψ,ρ˙),其余列的数据的意义和LIDAR一样。
首先我们读取整个数据:
dataset = []
# read the measurement data, use 0.0 to stand LIDAR data
# and 1.0 stand RADAR data
with open('data_synthetic.txt', 'rb') as f:
lines = f.readlines()
for line in lines:
line = line.strip('\n')
line = line.strip()
numbers = line.split()
result = []
for i, item in enumerate(numbers):
item.strip()
if i == 0:
if item == 'L':
result.append(0.0)
else:
result.append(1.0)
else:
result.append(float(item))
dataset.append(result)
f.close()
初始化 P P P,激光雷达的测量矩阵(线性) H L H_L HL,测量噪声 R R R, 处理噪声的中直线加速度项的标准差 σ a \sigma_a σa,转角加速度项的标准差 σ ω ˙ \sigma_{\dot\omega} σω˙:
P = np.diag([1.0, 1.0, 1.0, 1.0, 1.0])
print(P, P.shape)
H_lidar = np.array([[ 1., 0., 0., 0., 0.],
[ 0., 1., 0., 0., 0.]])
print(H_lidar, H_lidar.shape)
R_lidar = np.array([[0.0225, 0.],[0., 0.0225]])
R_radar = np.array([[0.09, 0., 0.],[0., 0.0009, 0.], [0., 0., 0.09]])
print(R_lidar, R_lidar.shape)
print(R_radar, R_radar.shape)
# process noise standard deviation for a
std_noise_a = 2.0
# process noise standard deviation for yaw acceleration
std_noise_yaw_dd = 0.3
在整个预测和测量更新过程中,所有角度量的数值都应该控制在 [ − π , π ] [-\pi, \pi] [−π,π],我们知道角度加减 2 π 2\pi 2π 不变,所以用如下函数表示函数来调整角度:
def control_psi(psi):
while (psi > np.pi or psi < -np.pi):
if psi > np.pi:
psi = psi - 2 * np.pi
if psi < -np.pi:
psi = psi + 2 * np.pi
return psi
使用第一个雷达(或者激光雷达)的测量数据初始化我们的状态,对于激光雷达数据,可以直接将测量到的目标的
(
x
,
y
)
(x, y)
(x,y) 坐标作为初始
(
x
,
y
)
(x, y)
(x,y),其余状态项初始化为0,对于雷达数据,可以使用如下公式由测量的
ρ
,
ψ
,
ρ
˙
\rho , \psi , \dot\rho
ρ,ψ,ρ˙ 得到目标的坐标
(
x
,
y
)
(x, y)
(x,y):
x
=
ρ
×
cos
(
ψ
)
x = \rho \times \cos(\psi)
x=ρ×cos(ψ)
y
=
ρ
×
sin
(
ψ
)
y = \rho \times \sin(\psi)
y=ρ×sin(ψ)
具体状态初始化代码为:
state = np.zeros(5)
init_measurement = dataset[0]
current_time = 0.0
if init_measurement[0] == 0.0:
print('Initialize with LIDAR measurement!')
current_time = init_measurement[3]
state[0] = init_measurement[1]
state[1] = init_measurement[2]
else:
print('Initialize with RADAR measurement!')
current_time = init_measurement[4]
init_rho = init_measurement[1]
init_psi = init_measurement[2]
init_psi = control_psi(init_psi)
state[0] = init_rho * np.cos(init_psi)
state[1] = init_rho * np.sin(init_psi)
print(state, state.shape)
写一个辅助函数用于保存数值:
# Preallocation for Saving
px = []
py = []
vx = []
vy = []
gpx = []
gpy = []
gvx = []
gvy = []
mx = []
my = []
def savestates(ss, gx, gy, gv1, gv2, m1, m2):
px.append(ss[0])
py.append(ss[1])
vx.append(np.cos(ss[3]) * ss[2])
vy.append(np.sin(ss[3]) * ss[2])
gpx.append(gx)
gpy.append(gy)
gvx.append(gv1)
gvy.append(gv2)
mx.append(m1)
my.append(m2)
定义状态转移函数和测量函数,使用numdifftools库来计算其对应的雅可比矩阵,这里我们先设 Δ t = 0.05 \Delta t = 0.05 Δt=0.05,只是为了占一个位置,当实际运行EKF时会计算出前后两次测量的时间差,一次来替换这里的 Δ t \Delta t Δt。
measurement_step = len(dataset)
state = state.reshape([5, 1])
dt = 0.05
I = np.eye(5)
transition_function = lambda y: np.vstack((
y[0] + (y[2] / y[4]) * (np.sin(y[3] + y[4] * dt) - np.sin(y[3])),
y[1] + (y[2] / y[4]) * (-np.cos(y[3] + y[4] * dt) + np.cos(y[3])),
y[2],
y[3] + y[4] * dt,
y[4]))
# when omega is 0
transition_function_1 = lambda m: np.vstack((m[0] + m[2] * np.cos(m[3]) * dt,
m[1] + m[2] * np.sin(m[3]) * dt,
m[2],
m[3] + m[4] * dt,
m[4]))
J_A = nd.Jacobian(transition_function)
J_A_1 = nd.Jacobian(transition_function_1)
# print(J_A([1., 2., 3., 4., 5.]))
measurement_function = lambda k: np.vstack((np.sqrt(k[0] * k[0] + k[1] * k[1]),
math.atan2(k[1], k[0]),
(k[0] * k[2] * np.cos(k[3]) + k[1] * k[2] * np.sin(k[3])) / np.sqrt(k[0] * k[0] + k[1] * k[1])))
J_H = nd.Jacobian(measurement_function)
# J_H([1., 2., 3., 4., 5.])
EKF的过程代码:
for step in range(1, measurement_step):
# Prediction
# ========================
t_measurement = dataset[step]
if t_measurement[0] == 0.0:
m_x = t_measurement[1]
m_y = t_measurement[2]
z = np.array([[m_x], [m_y]])
dt = (t_measurement[3] - current_time) / 1000000.0
current_time = t_measurement[3]
# true position
g_x = t_measurement[4]
g_y = t_measurement[5]
g_v_x = t_measurement[6]
g_v_y = t_measurement[7]
else:
m_rho = t_measurement[1]
m_psi = t_measurement[2]
m_dot_rho = t_measurement[3]
z = np.array([[m_rho], [m_psi], [m_dot_rho]])
dt = (t_measurement[4] - current_time) / 1000000.0
current_time = t_measurement[4]
# true position
g_x = t_measurement[5]
g_y = t_measurement[6]
g_v_x = t_measurement[7]
g_v_y = t_measurement[8]
if np.abs(state[4, 0]) < 0.0001: # omega is 0, Driving straight
state = transition_function_1(state.ravel().tolist())
state[3, 0] = control_psi(state[3, 0])
JA = J_A_1(state.ravel().tolist())
else: # otherwise
state = transition_function(state.ravel().tolist())
state[3, 0] = control_psi(state[3, 0])
JA = J_A(state.ravel().tolist())
G = np.zeros([5, 2])
G[0, 0] = 0.5 * dt * dt * np.cos(state[3, 0])
G[1, 0] = 0.5 * dt * dt * np.sin(state[3, 0])
G[2, 0] = dt
G[3, 1] = 0.5 * dt * dt
G[4, 1] = dt
Q_v = np.diag([std_noise_a*std_noise_a, std_noise_yaw_dd*std_noise_yaw_dd])
Q = np.dot(np.dot(G, Q_v), G.T)
# Project the error covariance ahead
P = np.dot(np.dot(JA, P), JA.T) + Q
# Measurement Update (Correction)
# ===============================
if t_measurement[0] == 0.0:
# Lidar
S = np.dot(np.dot(H_lidar, P), H_lidar.T) + R_lidar
K = np.dot(np.dot(P, H_lidar.T), np.linalg.inv(S))
y = z - np.dot(H_lidar, state)
y[1, 0] = control_psi(y[1, 0])
state = state + np.dot(K, y)
state[3, 0] = control_psi(state[3, 0])
# Update the error covariance
P = np.dot((I - np.dot(K, H_lidar)), P)
# Save states for Plotting
savestates(state.ravel().tolist(), g_x, g_y, g_v_x, g_v_y, m_x, m_y)
else:
# Radar
JH = J_H(state.ravel().tolist())
S = np.dot(np.dot(JH, P), JH.T) + R_radar
K = np.dot(np.dot(P, JH.T), np.linalg.inv(S))
map_pred = measurement_function(state.ravel().tolist())
if np.abs(map_pred[0, 0]) < 0.0001:
# if rho is 0
map_pred[2, 0] = 0
y = z - map_pred
y[1, 0] = control_psi(y[1, 0])
state = state + np.dot(K, y)
state[3, 0] = control_psi(state[3, 0])
# Update the error covariance
P = np.dot((I - np.dot(K, JH)), P)
savestates(state.ravel().tolist(), g_x, g_y, g_v_x, g_v_y, m_rho * np.cos(m_psi), m_rho * np.sin(m_psi))
这里有几点需要注意,首先,要考虑清楚有几个地方被除数有可能为 0 0 0,比如说 ω = 0 \omega = 0 ω=0,以及 ρ = 0 \rho = 0 ρ=0 的情况。
处理完以后我们输出估计的均方误差(RMSE),并且把各类数据保存以便我们可视化我们的EKF的效果:
def rmse(estimates, actual):
result = np.sqrt(np.mean((estimates-actual)**2))
return result
print(rmse(np.array(px), np.array(gpx)),
rmse(np.array(py), np.array(gpy)),
rmse(np.array(vx), np.array(gvx)),
rmse(np.array(vy), np.array(gvy)))
# write to the output file
stack = [px, py, vx, vy, mx, my, gpx, gpy, gvx, gvy]
stack = np.array(stack)
stack = stack.T
np.savetxt('output.csv', stack, '%.6f')
最后我们来看一下我们的EKF在追踪目标的时候的均方误差:
0.0736336090893 0.0804598933194 0.229165985264 0.309993887661
我们把我们的EKF的估计结果可视化:
我们放大一个局部看一下:
其中,蓝色的点为我们的EKF对目标位置的估计,橙色的点为来自LIDAR和RADAR的测量值,绿色的点是目标的真实位置,由此可知,我们的测量是不准确的,因此我们使用EKF在结合运动模型的先验知识以及融合两个传感器的测量的基础上做出了非常接近目标正是状态的估计。
EKF的魅力其实还不止在此!我们使用EKF,不仅能够对目标的状态(我们关心的)进行准确的估计,从这个例子我们会发现,EKF还能估计我们的传感器无法测量的量(比如本例中的 v , ψ , ψ ˙ v, \psi, \dot\psi v,ψ,ψ˙)
那么,扩展卡尔曼滤波就到此结束了,大家可能会问,怎么没看到可视化结果那一部分的代码?哈哈,为了吸引一波人气,请大家关注我的博客,我会在下一期更新中(无损卡尔曼滤波)提供这一部分代码。
最后,细心的同学可能会发现,我们这个EKF执行的效率太低了,实际上,EKF的一个最大的问题就是求解雅可比矩阵计算量比较大,而且相关的偏导数推导也是非常无聊的工作,因此引出了我们下一篇要讲的内容,无损卡尔曼滤波(Unscented Kalman Filter,UKF)