WiFi感知领域-论文研读：WiFi-Based Human Pose Image Generation

最新推荐文章于 2024-07-17 17:54:33 发布

　☆cwlulu

最新推荐文章于 2024-07-17 17:54:33 发布

阅读量1.4k

点赞数 22

文章标签：人工智能

本文链接：https://blog.csdn.net/qq_71320435/article/details/136985269

版权

论文介绍了一种结合无线信号和光学图像生成人体姿态的新方法，利用深度学习处理CSI数据和初始图像，通过GAN实现高质量图像合成。实验结果显示，该方法在WiFiDance和WiFiWalk数据集上优于现有技术，具有更好的精度和视觉质量。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文概述

提出了一种通过将无线信号与初始光学图像相结合来生成目标人体姿态图像的框架。使用多个无线设备来收集WiFi信号，并使用相机来捕捉初始光学图像。最后，深度学习模型从处理后的无线信号和初始光学图像中学习生成人体姿态图像。

研究背景

光学相机很容易受到光线不好或浓烟和灰尘的限制。从无线电信号中提取的信息非常缺乏，只能获得人类的低分辨率姿势，而环境信息被完全遗漏。

解决方法：

将无线电信号与初始光学图像相结合来合成人类活动的光学图像。照明良好时，初始光学图像可获得环境和人类主体的外观信息。照明变差后（例如，照明设备关闭、浓烟或灰尘遮挡摄像头等），无线电感应设备就会工作。

场景构建

本文目标是仅从一个初始图像和WiFi信号生成不同时间的光学人体姿态图像。系统由两个主要部分组成：数据收集和预处理，以及深度学习模型。

在10米×10米的区域内，有一个配备了一个天线的WiFi发射器和五个接收器，每个接收器配备了三个天线。受试者被要求在场景中进行一些活动，其中包括各种人体姿势和肢体动作。

上图是为收集WiFi和视觉数据而构建的场景。左边是实际场景，右边是显示相机以及WiFi发射器和接收器放置的示意图。

数据分析

CSI会随着人的运动而变化，即CSI包含人的运动信息。测量的CSI可以表示为

m、 k，t分别表示天线、子载波和时间的索引 zls表示由室内环境引入的静态信号传播路径，它是时不变的 zld是由移动的人反射的信号，它由于人的移动而是时变的。

由于CSI中涉及的信息有限，故利用多个接收器来通过获取更多信息。 CSI包含几种时变相位偏移，会影响传感性能，本文仅利用CSI的幅度，即z的绝对值，作为神经网络的输入。

模型结构

主要包括两个部分：一个从CSI数据预测姿态关键点的轻量级WiFi——关键点网络一个生成基于预测姿态和初始图像的光学图像的GAN网络。

CSI用维度R×F×N表示，R表示接收天线的数量，F表示子载波数量，N表示一定时间内WiFi帧的数量。由于WiFi信号的低空间分辨率，单个WiFi帧可能会错过一些肢体，并且无法对身体运动的动力学进行建模。因此输入从一段时间（例如0.1s）获得的多个WiFi帧，然后遵循几个卷积层来提取信息。最后，采用仿射变换M来获得姿势关键点坐标： p_k×2^^=M[CNN(z)] 目标函数是最小化每个关键点的预测坐标与相应真值之间的误差：

p_i^表示第i个关键点的预测坐标，pi是真值坐标

WiFi信号只能捕捉人体的运动，不能获得环境信息，本文使用初始人体姿态图像来补充WiFi信号的环境信息。 GAN模块主要由三部分组成：编码器网络、一系列条件残差块、解码器网络将关键点像素坐标转换为高斯热图h，然后使用Pose-Attention（PA）操作将姿势热图h与从初始图像中提取的特征相组合：