MIT Cheetah Learning (一)：State Estimate

最新推荐文章于 2024-04-13 21:35:55 发布

Demphi

最新推荐文章于 2024-04-13 21:35:55 发布

阅读量2.3k

点赞数 9

分类专栏：论文学习 MIT Cheetah学习文章标签：算法

本文链接：https://blog.csdn.net/Everlasting_Aa/article/details/120920668

版权

论文学习同时被 2 个专栏收录

1 篇文章

订阅专栏

MIT Cheetah学习

1 篇文章

订阅专栏

文章目录

MIT Cheetah Learning (一)：State Estimate

MIT Cheetah Learning (一)：State Estimate

MIT Cheetah 3中融合了许多论文中的算法和技术。
论文链接：MIT Cheetah 3: Design and Control of a Robust, Dynamic Quadruped Robot
MIT Cheetah Learning系列将解析Cheetah的算法部分，尝试将其中每一个模块解释清楚。

Cheetah 3 中的State Estimate是参考2013年ETH的论文——
“State Estimation for Legged Robots - Consistent Fusion of Leg Kinematics and IMU”
论文链接：State Estimation for Legged Robots - Consistent Fusion of Leg Kinematics and IMU

因此，只需搞明白ETH的论文即可。
下面将具体介绍论文是如何用IMU与编码器实现State Estimate

Summary

以Extended Kalman Filter（EKF）算法为核心，仅使用IMU与电机的编码器，可以准确估计除了yaw和absolute position以外的机器人状态（yaw和absolute position在短距离运动中误差也仅在10%），包括roll、pitch、velocity。
在任意步态、任意地形下，都可以实现对机器人的状态估计。前提是机器人至少有一条腿与地面接触，并且假设机器人与地面接触时，仅会发生非常小的的滑动。

先验知识

A.Extended Kalman Filter

Definition:
$\theta_k$ 为真实值， $\theta'_k$ 为模型预测值， $\langle \theta_k \rangle$ 为估计值（系统输出）， $z_k$ 为系统观测值， $s_k$ 为状态转移噪声，服从高斯分布， $v_k$ 为观测噪声，也服从高斯分布

EKF的状态转移方程和观测方程如下：
$\left\{ \begin{array}{ll} \theta_k = f(\theta_{k-1})+s_k & (1)\\ z_k = h(\theta_{k}) + v_k & (2) \end{array}\right.$
对(1)(2)式进行泰勒展开（雅克比矩阵性质： $f(x_0)+J \cdot(x-x_0)$ ），得到
$\left\{ \begin{array}{ll} \theta_k = f(\theta_{k-1})+s_k = f(\langle \theta_{k-1} \rangle)+F_{k-1}(\theta_{k-1}-\langle \theta_{k-1} \rangle)+s_k & (3)\\ z_k = h(\theta_{k}) + v_k = h(\theta'_k) + H(\theta-\theta'_k) +v_k& (4) \end{array}\right.$
引入反馈
$\langle \theta_{k} \rangle = \theta'_k+K_k(z_k-h(\theta'_k))$
由以上式子可以得到EKF的Predict和Update部分
Predict:
$\left\{ \begin{array}{ll} \theta'_k = f(\langle \theta_{k-1} \rangle)\\ \Sigma'_k = F_{k-1} \Sigma'_{k-1} F_{k-1}^T + Q \end{array}\right.$
Update:
$\left\{ \begin{array}{ll} S_k = (H_{k} \Sigma'_{k} H_{k}^T+R)^{-1}\\ K_k = \Sigma'_k H^T_{k} S_k \\ \langle \theta_{k} \rangle = \theta'_k+K_k(z_k-h(\theta'_k)) \\ \Sigma_k = (I-K_k H_k)\Sigma'_k \end{array}\right.$

其中，雅克比矩阵 $F_k = \frac{\partial f}{\partial \theta}|_{\langle \theta_{k-1} \rangle}$

雅克比矩阵 $H_k = \frac{\partial h}{\partial \theta}|_{\theta'_k}$

协方差矩阵 $\Sigma_k = \langle (\theta_k-\langle \theta_k \rangle)(\theta_k-\langle \theta_k \rangle)^T \rangle$ ，表示估计值与真实值之间的误差

协方差矩阵 $\Sigma'_k = \langle (\theta_k-\theta'_k) (\theta_k-\theta'_k)^T \rangle$ ，表示预测值与真实值之间的误差

状态转移噪声协方差矩阵 $\langle s_k s_k^T\rangle$

观测噪声协方差矩阵 $\langle v_k v_k^T\rangle$

$K_k$ 为卡尔曼增益

具体推导可参考扩展卡尔曼滤波

B.四元数、旋转矩阵、李群李代数等

参考书籍：《视觉SLAM十四讲(第二版)》—— 高翔著

以下定义会在后续会使用到：

$(\cdot)^{\times}$ 表示将向量转化成反对称矩阵
$\Omega(\cdot)$ 将任意的角速度转化为4 ${\times}4$ 矩阵，表示相应的四元速率
$\Omega : \omega \mapsto \Omega(\omega) = \begin{bmatrix} 0 & \omega_z & -\omega_y & \omega_x\\ -\omega_z & 0 & \omega_x & \omega_y \\ \omega_y & -\omega_x & 0 & \omega_z \\ -\omega_x & -\omega_y & -\omega_z & 0 \end{bmatrix}$
$\zeta(\cdot)$ 将旋转向量的误差转化为四元数误差
$\zeta : v \mapsto \zeta(v) = \begin{bmatrix} sin(\frac{1}{2}||v||)\frac{v}{||v||} \\ cos(\frac{1}{2}||v||) \end{bmatrix}$

Part 1——Sensor Device and Measurement Models

A. Encoders

增量式编码器提供了所有电机的转动真实角度 $\alpha$ ，该反馈信息受到 $n_{\alpha}$ 高斯噪声的影响
$\tilde{\alpha} = \alpha + n_{\alpha}$
因此由正运动学可知所有足端在 $B o d y F r a m e$ ( $B$ )下的坐标 $s_i$
$s_i = lkin_i(\alpha) + n_{s,i}$
$lkin_i(\cdot)$ 表示腿部正运动学模型， $n_{s, i}$ 表示离散高斯噪声（校准误差与运动学模型误差）
定义—— $R_{\alpha}$ 为 $n_{\alpha}$ 的协方差矩阵， $R_s$ 为 $n_{i,s}$ 的协方差矩阵

B. IMU

由Part 1中IMU模型可知

加速度计得到在 $B$ 下的加速度 $f$ ，陀螺仪得到在 $B$ 下的角速度 $\omega$

旋转矩阵 $C$ 表示从世界坐标系 $I$ 到机器人坐标系 $B$ 变换

$a$ 表示 $I$ 下的加速度

因此可得
$f = C (a - g)$ $\tilde{f} = f+b_f+w_f$ $\dot b_f = \omega_{bf}$ $\tilde{\omega} = \omega+b_{\omega}+w_{\omega}$ $\dot b_{\omega} = \omega_{b\omega}$
其中 $\tilde{f},\tilde{\omega}$ 是受高斯噪声项 $\omega_{f},w_{\omega}$ 和偏置项 $b_f,b_{\omega}$ 影响得到的测量值，且偏置项的导数可以由高斯噪声 $\omega_{bf},\omega_{b\omega}$ 表示

定义以上四个高斯噪声的协方差矩阵为 $Q_f, Q_{bf},Q_{\omega},Q_{b\omega}$

Part 2——State Estimate

A.Filter State Definition

Definition:
$r$ 为在世界坐标系 $I$ 下，机器人身体中心的位置

$v$ 为机器人在世界坐标系 $I$ 下的速度

$q$ 为世界坐标系 $I$ 到机器人坐标系 $B$ 的旋转四元数

$p_1, p_2, ..., p_N$ 为机器人足端在世界坐标系 $I$ 下的位置

$b_f, b_{\omega}$ 为在机器人坐标系 $B$ 下，IMU的偏置项（可由旋转矩阵转化到世界坐标系 $I$ 下）

因此我们定义
$p_1, ..., p_N, b_f, b_{\omega})$ $cov(\Delta x)$ $\Delta x := (\Delta r, \Delta v, \Delta q, \Delta p_1, ..., \Delta p_N, \Delta b_f, \Delta b_{\omega})$

B.Prediction Model(IMU)

由Part 1中IMU模型可知
$\begin{aligned} &\dot{r} = v \\ & \dot{v}=a=C^T(\tilde{f}-b_f-\omega_f)+g \\ &\dot{q} = \frac{1}{2}\Omega(\omega) q = \frac{1}{2}\Omega(\tilde{\omega}-b_{\omega}-\omega_{\omega})q \\ & \dot{p_i} = C^T\omega_{p,i},\forall i \in {1, ..., N} \\ & \dot{b_f} = \omega_{bf} \\ & \dot{b_\omega} = \omega_{b\omega} \end{aligned}$
白噪声 $\omega_{p,i}$ 表示足端与地面接触可能产生的微小滑动

$Q_{p,i}$ 为 $\omega_{p,i}$ 的协方差矩阵，定义如下:
$Q_{p,i} : = \begin{bmatrix} \omega_{p,i,x} & 0 & 0 \\ 0 & \omega_{p,i,y} & 0 \\ 0 & 0 & \omega_{p,i,z} \end{bmatrix}$

C.Measurement Model(Encoders)

由Part 1中Encoders模型可知
$\tilde{s_i}:=lkin_i(\tilde{\alpha}) \\ \approx lkin_i(\alpha)+J_{lkin,i}n_{\alpha} \\ \approx s_i \underbrace{- n_{s,i}+J_{lkin,i}n_{\alpha}}_{n_{i}}$
其中，雅克比矩阵 $J_{lkin,i}:=\frac{\partial lkin_i(\alpha)}{\partial \alpha_i}$
$n_{i}$ 可视为经过线性离散化的噪声，包含编码器噪声和正运动学计算噪声，即观测误差
$R_i$ 是每一条腿的观测误差协方差矩阵，同时由Part 1.A可知
$R_i = R_s+J_{lkin,i}R_{\alpha}J_{lkin,i}^T$

由定义可知， $\tilde{s_i}$ 可以表示 $\tilde{s_i} = C(p_i-r)+n_i$ ，即足端坐标与机器人中心坐标（世界坐标系 $I$ ）的差值乘上旋转矩阵

D.Extended Kalman Filter

将编码器视为观测值， $\Delta x$ 视为真实值，即可建立EKF状态转移方程与观测方程，如下
$\left\{ \begin{array}{ll} \Delta x_k = f(\Delta x_{k-1})+q_k \\ s_k = h(\Delta x_{k}) + v_k \end{array}\right.$
Predict:
经过模型线性化处理之后（参考文章Computing integrals involving the matrix exponential），得到关于 $\Delta x$ 的协方差矩阵 $F_k$ ，以及离散过程噪声的协方差矩阵 $Q_k$ （ $Q_k$ 包含了 $Q_f, Q_{bf},Q_{\omega},Q_{b\omega}$ ）
两个协方差矩阵 $F_k,Q_k$ 的具体表达式在论文中由展示，在这里便不展示了（会涉及反对称阵，四元数，e指数，罗德里格斯公式等）
因此可以得到
$\left\{ \begin{array}{ll} \Delta' x = f(\langle \Delta x_{k-1} \rangle)\\ P^-_{k+1} = F_k P^+_k F_k^T + Q_k \end{array}\right.$

Update:
引入 $y_k$ ，定义如下：
$y_k : = \left(\begin{array}{l} (\tilde{s}_{1,k}-\hat{C}^-_k(\hat{p}^-_{1,k}-\hat{r}^-_k) \\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \vdots \\ (\tilde{s}_{N,k}-\hat{C}^-_k(\hat{p}^-_{N,k}-\hat{r}^-_k) \end{array} \right)$
关于式子 $\tilde{s}_{i,k}-\hat{C}^-_k(\hat{p}^-_{i,k}-\hat{r}^-_k)$ ，使用泰勒展开，忽略所有的高阶项，得到
$\tilde{s}_{i,k}-\hat{C}^-_k(\hat{p}^-_{i,k}-\hat{r}^-_k) \approx -\hat{C}^-_k \Delta r^-_k+\hat{C}^-_k \Delta p^-_{i,k}+(\hat{C}^-_k(\hat{p}^-_{i,k}-\hat{r}^-_k))^{\times}\Delta \phi^-_k$
证明如下：

定义 $\frac{\partial g( x_k)}{\partial x_k} := \tilde{s}_{i,k}-\hat{C}^-_k(\hat{p}^-_{i,k}-\hat{r}^-_k)$
$\because \frac{\partial g( x_k)}{\partial x_k} = -\hat{C}^-_k \Delta r^-_k+\hat{C}^-_k \Delta p^-_{i,k}+(\hat{C}^-_k(\hat{p}^-_{i,k}-\hat{r}^-_k))^{\times}\Delta \phi^-_k+G(\Delta v^-_k)$
$=-\hat{C}^-_k \Delta r^-_k+\hat{C}^-_k \Delta p^-_{i,k}+(\hat{C}^-_k(\hat{p}^-_{i,k}-\hat{r}^-_k))^{\times}\Delta \phi^-_k$
$G(\Delta v^-_k)$ 可视为 $-\hat{C}^-_k \Delta r^-_k$ 的高阶项，因此可以忽略
$\therefore \tilde{s}_{i,k}-\hat{C}^-_k(\hat{p}^-_{i,k}-\hat{r}^-_k) \approx -\hat{C}^-_k \Delta r^-_k+\hat{C}^-_k \Delta p^-_{i,k}+(\hat{C}^-_k(\hat{p}^-_{i,k}-\hat{r}^-_k))^{\times}\Delta \phi^-_k$
因此我们可以得到雅克比矩阵 $H_k = \frac{\partial y_k}{\partial x_k}$
$H_k = \begin{bmatrix} -\hat{C}^-_k & 0 & (\hat{C}^-_k(\hat{p}^-_{1,k}-\hat{r}^-_k))^{\times} & \hat{C}^-_k & \cdots& 0 & 0 & 0 \\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \vdots \\ -\hat{C}^-_k & 0 & (\hat{C}^-_k(\hat{p}^-_{N,k}-\hat{r}^-_k))^{\times} & \hat{C}^-_k & \cdots& 0 & 0 & 0 \end{bmatrix}$
由Part 2.C可知， $R_k$ 是观测误差的协方差矩阵
$R_k = \begin{bmatrix} R_{1,k} & &\\ & \ddots \\ & & R_{N,k} \end{bmatrix}$
因此我们可以得到EFK的Update等式，如下：
$\left\{ \begin{array}{ll} S_k = (H_{k} P^-_{k} H_{k}^T+R_k)\\ K_k = P^-_{k} H^T_{k} S^{-1}_k \\ \langle \Delta x_k \rangle = K_k y_k & (*)\\ P^+_{k} = (I-K_k H_k)P^-_k \end{array}\right.$
$(*)$ 式证明如下：
$\langle \Delta x_{i,k} \rangle = \Delta x'_{i,k}+K_k(\tilde{s}_{i,k}-\hat{C}^-_k(\hat{p}^-_{i,k}-\hat{r}^-_k))$
由于 $\Delta x'_{i,k}$ 与 $\hat{C}^-_k(\hat{p}^-_{i,k}-\hat{r}^-_k)$ 式等价的
$\therefore \langle \Delta x_{i,k} \rangle = K_k y_k$