《MoRe-Fi: Motion-robust and Fine-grained Respiration Monitoring via Deep-Learning UWB Radar》学习笔记
本文要点:
- 利用商用IR-UWB雷达实现无接触传感
- 深度学习(新型变分译码网络)恢复出由身体运动以非线性方式调制呼吸波形
- MoRe-Fi在肺部疾病诊断中的潜在应用
新知识点:
- 使用环回过滤器[2014.3D Tracking via Body Radio Reflections]来消除静态背景的影响。
- 使用恒虚警率算法[1988.Radar Principles. Wiley]来检测峰值
- 数据扩充的方法,保留A,去掉B
- 用VED从非线性信号中恢复呼吸波形
文章目录
1. 现有RF-sensing系统缺陷
问题:呼吸和身体运动无法同时监测,运动时无法从射频信号中提取呼吸波形
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PhBeVAMK-1640866569666)(C:\Users\bupt\AppData\Roaming\Typora\typora-user-images\image-20211228155723650.png)]
问题溯源:
- 现有系统所依赖的线性滤波无法提取细粒度的呼吸波形
- 身体运动对复射频信号的影响难以建模衡量
- 人体运动和呼吸的反射信号是非线性合成的,难以区分
- 基于模型的方法无法完成获取身体运动反射信号的各种统计特性
问题解决思路:
- 基于商用级IR-UWB雷达平台,利用其大带宽实现高分辨率的运动感知
- 分析呼吸在复数域的同相和正交(I/Q)分量中是如何调制的
- 利用IQ信号表示的特点,设计相应的数据扩充步骤来丰富已有的呼吸数据集的信息——充分利用I/Q分量
- 驱动IQ变分编码器-解码器(IQ- VED,IQ Variational Encoder-Decoder)实现呼吸波形的鲁棒恢复——变分推理(Variational Inference)的泛化性
2. 雷达信号的建模
2.1 IR-UWB Radar捕获的呼吸信号
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wD205qC2-1640866569668)(C:\Users\bupt\AppData\Roaming\Typora\typora-user-images\image-20211228160003179.png)]
雷达发射的信号 x ( t ) x(t) x(t)是由高斯脉冲 s ( t ) s(t) s(t)通过频率为 f c f_c fc的正弦信号调制来的,接受信号 x ( t ) ∗ h ( t ) x(t)*h(t) x(t)∗h(t)经过对应的解调得到IQ分量。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AlWm0vYq-1640866569668)(C:\Users\bupt\AppData\Roaming\Typora\typora-user-images\image-20211228160420003.png)]
F3(a)是单帧的雷达复信号的振幅,可以从单帧的快时域(将信号叠加到一个脉冲时间内)中区分不同距离的物体。由于单帧信号不足以监测呼吸,考虑呼吸的周期性,雷达按一定的间隔发送帧,并将接收到的帧进行叠加形成信号矩阵
r
(
t
)
=
[
r
1
(
t
)
,
⋯
r
n
(
t
)
,
⋯
r
N
(
t
)
]
T
\boldsymbol{r}(t)=\left[r_{1}(t), \cdots r_{n}(t), \cdots r_{N}(t)\right]^{T}
r(t)=[r1(t),⋯rn(t),⋯rN(t)]T,第N帧信号在快时域中的振幅。这个矩阵记为
r
(
t
,
n
)
\boldsymbol{r}(t,n)
r(t,n),F3(b)是一个接受信号矩阵,红框圈出的部分就是由呼吸人体导致的周期性幅度峰值。
传统方法一般采用慢时信号
r
t
(
n
)
r_{t}(n)
rt(n)的幅值或相位来画呼吸波形,如F4所示。虽然周期性结构类似于呼吸的“基带”,这两个实序列都不能完全准确地描述呼吸波形。如F4(a)中的信号强度畸变(strength variation),F4(b)中的周期畸变(missing cycles)。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yR0LEPVC-1640866569669)(C:\Users\bupt\AppData\Roaming\Typora\typora-user-images\image-20211229222808713.png)]
为分析上述两种畸变(distortions)的来源,对于
r
t
(
n
)
r_{t}(n)
rt(n)在IQ分量上的表达式:
r
I
(
n
)
=
α
(
n
)
cos
(
4
π
d
0
λ
+
4
π
z
(
n
)
λ
)
+
o
I
B
B
R
r
Q
(
n
)
=
α
(
n
)
sin
(
4
π
d
0
λ
+
4
π
z
(
n
)
λ
)
+
o
Q
B
B
R
(1)
\begin{aligned} &r_{\mathrm{I}}(n)=\alpha(n) \cos \left(\frac{4 \pi d_{0}}{\lambda}+\frac{4 \pi z(n)}{\lambda}\right)+o_{\mathrm{I}}^{\mathrm{BBR}} \\ &r_{Q}(n)=\alpha(n) \sin \left(\frac{4 \pi d_{0}}{\lambda}+\frac{4 \pi z(n)}{\lambda}\right)+o_{Q}^{\mathrm{BBR}} \end{aligned}\tag{1}
rI(n)=α(n)cos(λ4πd0+λ4πz(n))+oIBBRrQ(n)=α(n)sin(λ4πd0+λ4πz(n))+oQBBR(1)
其中,
α
(
n
)
\alpha(n)
α(n)人体反射信号的强度,
d
0
d_{0}
d0是雷达到胸腔的距离,
λ
\lambda
λ是载波波长,
z
(
n
)
z(n)
z(n)表示胸腔运动。在两个方程中,第一项是由呼吸引起,第二项为静态反射(BBR,body background reflection)引起的偏移。F5是两个方程的可视化。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zqHrDF6J-1640866569669)(C:\Users\bupt\AppData\Roaming\Typora\typora-user-images\image-20211230145458611.png)]
呼吸向量是静态背景偏置+由呼吸产生的动态向量的矢量和。红色向量转动时并非一个圆,因为人体反射信号的强度 α ( n ) \alpha(n) α(n)由于雷达的cross-section而时变。图5(a), 为什么振幅和相位波形都不能正确地表征图4中的呼吸波形: 尽管它们振荡的频率与人类呼吸相似,但它们只是呼吸矢量轨迹在较低维上的投影。
2.2 身体运动引起的干扰
对人体的运动增加一些限定,首先人体一定要在雷达的视场范围( FoV, Field of View 内,其次,运动的人体在短时间类,运动范围保持在一个相对合理的范围中( d ± Δ d d \pm \Delta d d±Δd)。如不影响胸腔的的身体运动(打字、四肢活动、固定地点的锻炼等),但剧烈改变姿势、显著改变位置是不可行的(如站→躺,轨迹追踪)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gRQyu8Da-1640866569670)(C:\Users\bupt\AppData\Roaming\Typora\typora-user-images\image-20211230153247282.png)]
在限定范围的基础上,通过一个简单的实验来分析肢体动作对I/Q信号的影响。让一个人坐在椅子上移动他的身体(前倾和后倾,左右摇摆)。其
r
(
n
)
r(n)
r(n)如F5(b)所示,叠加了运动的呼吸轨迹以一种相当随意的方式分散在I/Q平面上。原因:
①是BBR偏移(由来自环境、四肢和躯干的反射,区别于胸腔反射)以前可视为静止的,现在不再是静止的,导致椭圆中心随机移动。
②是由(1)中方程可知,当
d
0
d_{0}
d0改变时,IQ图中的相位会变化。
③是雷达的cross-section会随人体运动而变化,导致反射信号强度
α
(
n
)
\alpha(n)
α(n)变化。
④是F5(b)仅仅是一个快时间内的,而大规模波动会影响多个快时间指数。
2.3 传统呼吸提取方法
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FIFyjt4P-1640866569671)(C:\Users\bupt\AppData\Roaming\Typora\typora-user-images\image-20211230145458611.png)]
对于呼吸向量,人体的胸腔位移
Δ
d
\Delta d
Δd和信号相位变化
Δ
ϕ
\Delta \phi
Δϕ,存在
Δ
d
=
λ
Δ
ϕ
2
π
\Delta d=\lambda \frac{\Delta \phi}{2 \pi}
Δd=λ2πΔϕ,当BBR改变时,椭圆圆心会不重合,所以从原始的I/Q信号中无法获得
Δ
ϕ
\Delta \phi
Δϕ。
为恢复呼吸波形,[2020. SpiroSonic]将椭圆弧线拟合到(声学)I/Q信号,并将其中心与原点统一起来。虽然从理论上讲,这种方法允许通过取移位的I/Q信号的切向倒数来计算呼吸矢量的相位,但它本质上为准静态人体受试者设计,只能容忍非常小的肢体位置漂移(例如,手持手机时的手部动作),选择性地拟合到相对“干净”且没有强烈运动干扰的数据段。
在较强的运动下,椭圆弧线形式的呼吸矢量的轨迹不再可识别和分析。因此,回到图4所示的一维信号投影,并采用前人的线性处理方法来提取呼吸,如带通滤波、集合经验模态分解(Ensemble Empirical Mode Decomposition, EEMD)[83],变分模态分解(Variational Mode Decomposition, VMD)[90]。用其处理人体锻炼时的数据,有F7。由于这些方法未能正确处理大幅度运动的I/Q不规则性和一个运动在多个快时间中交叉的问题,因此肯定无法处理2.2节定义的身体运动范围。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Vstm6XFC-1640866569671)(C:\Users\bupt\AppData\Roaming\Typora\typora-user-images\image-20211230164936871.png)]
综上所述,为了恢复强身体运动下的细粒度呼吸波形,我们必须充分利用I/Q信号,跟踪其在多个快时指标上的变化。然而,由于传统的基于模型的信号处理算法已被证明无法处理这种情况,我们求助于数据驱动的方法。
3. 系统设计
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dCJqzI2W-1640866569672)(C:\Users\bupt\AppData\Roaming\Typora\typora-user-images\image-20211230165357887.png)]
- MoRe-Fi 从 r ( t , n ) r(t,n) r(t,n)中先定位呼吸相关的信息得到一个子矩阵。
- 利用I/Q域中的旋转不变性来扩充子矩阵。
- IQ变分编码器-解码器(IQ- VED)神经网络,用于从子矩阵中提取呼吸波形
- IQ-VED通过可穿戴传感器[2017. Respiration Monitor Belt Logger Sensor NUL-236]获得的ground truth波形进行训练,恢复身体运动产生的严重干扰下的细粒度呼吸波形。
3.1 呼吸波形矩阵的定位
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AQ05lrdc-1640866569672)(C:\Users\bupt\AppData\Roaming\Typora\typora-user-images\image-20211230170441645.png)]
- 使用环回过滤器[2014.3D Tracking via Body Radio Reflections]来消除静态背景的影响。
- 使用恒虚警率算法[1988.Radar Principles. Wiley]来检测峰值
- 选取峰值符进的快时域时段组成子矩阵,转置
3.2 数据扩充
作用: 1)通过应用某些转换来增加数据集的多样性; 2)有助于深度神经网络理解原始数据的内在结构
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dAMYLeI5-1640866569673)(C:\Users\bupt\AppData\Roaming\Typora\typora-user-images\image-20211230191712803.png)]
通过旋转
r
^
(
n
)
\hat{\boldsymbol{r}}(n)
r^(n)在I/Q域中的每个复元素:
[
r
I
aug
r
Q
aug
]
=
[
cos
θ
−
sin
θ
sin
θ
cos
θ
]
[
r
I
r
Q
]
(2)
\left[\begin{array}{l} r_{\mathrm{I}}^{\text {aug }} \\ r_{\mathrm{Q}}^{\text {aug }} \end{array}\right]=\left[\begin{array}{cc} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{array}\right]\left[\begin{array}{l} r_{\mathrm{I}} \\ r_{\mathrm{Q}} \end{array}\right]\tag{2}
[rIaug rQaug ]=[cosθsinθ−sinθcosθ][rIrQ](2)
旋转保留了呼吸痕迹,虽然改变了
d
0
d_{0}
d0,但不会丢失
Δ
d
\Delta d
Δd的相关信息,在实践中,MoRe-Fi会使用更多旋转角度更好地丰富数据集。
3.3 细粒度的波形恢复
本节首先研究变分编码器解码器(VED,Variational Encoder Decoder)的背景,然后讨论了如何使VED体系结构适应I/Q复信号,最后提供了使用IQ-VED恢复呼吸波形的详细信息。
3.3.1 VED设计原理
**目的:**从非线性信号混合中提取特定的信号
**已有工作的缺陷:**编码器-解码器(ED,Encoder-Decoder )网络在训练数据有限的情况下,潜在空间不是连续的
**思想:**受变分推理(variational inference)思想的启发,使编码器返回概率分布而不是离散向量来解决潜在空间不规则的问题,记为VED。
**和相似事物的区别:**VED与变分自动编码器(VAE,Variational AutoEncode)有根本的不同,VED旨在从非线性混合物中提取信号,而VAE旨在学习输入的有效表示
**VED生成公式:**略,此处需要额外找资料,文中过于精简不适合无基础人士查看
3.3.2 IQ-VED Encoder.
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tpvaolBc-1640866569673)(C:\Users\njupt\AppData\Roaming\Typora\typora-user-images\image-20211230194231329.png)]
本质上,IQ-VED编码器对输入I/Q信号进行分解,滤除运动干扰。呼吸信号( respiration-induced signal)压缩并映射到潜伏分布(latent distribution),然后采样驱动解码器,从而恢复所需的呼吸波形。在上图所示的结构中,由于单独对IQ分量进行处理虽然降低复杂度,但会造成失调。为解决这个问题,sec3.3.3中介绍了对齐了它们各自的潜在空间的方法。
3.3.3 Latent Space Alignment.
编码器的输出是两个高斯分布,利用雷达信号的同相信号和正交信号的相同结构来对应其Latent Space。问题转化为最小化两者的2-Wasserstein distance[ 1982. The Distance between Two Random Vectors with Given Dispersion Matrices.]。
3.3.4 IQ-VED Decoder and Loss Function
F12(b)所示,大体上是Encoder的对称,但不完全对称,在解码器的最后阶段,恢复的是单通道信号,而不是多通道信号作为编码器的输入。损失函数需要训练结果对比选出。
3.3.5 Waveform Recovery and Biomarker Recognition
从F11的输出中采用公式合并, r ∗ = arg max r ′ p ψ ( r ′ ∣ r I , r Q , z I ∗ + z Q ∗ ) r^{*}=\arg \max _{r^{\prime}} p_{\psi}\left(r^{\prime} \mid r_{\mathrm{I}}, r_{\mathrm{Q}}, z_{\mathrm{I}}^{*}+z_{\mathrm{Q}}^{*}\right) r∗=argmaxr′pψ(r′∣rI,rQ,zI∗+zQ∗),结果如F13所示
采用公式合并, r ∗ = arg max r ′ p ψ ( r ′ ∣ r I , r Q , z I ∗ + z Q ∗ ) r^{*}=\arg \max _{r^{\prime}} p_{\psi}\left(r^{\prime} \mid r_{\mathrm{I}}, r_{\mathrm{Q}}, z_{\mathrm{I}}^{*}+z_{\mathrm{Q}}^{*}\right) r∗=argmaxr′pψ(r′∣rI,rQ,zI∗+zQ∗),结果如F13所示
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6QvEHf9Y-1640866569673)(C:\Users\bupt\AppData\Roaming\Typora\typora-user-images\image-20211230200329766.png)]