论文阅读笔记：Classification of Human Activity Based on Radar Signal Using 1-D Convolutional Neural Network

最新推荐文章于 2024-07-17 16:29:42 发布

求学游子@

最新推荐文章于 2024-07-17 16:29:42 发布

阅读量185

点赞数

文章标签：论文阅读笔记机器学习

本文链接：https://blog.csdn.net/qq_45229168/article/details/130135887

版权

Classification of Human Activity Based on Radar Signal Using 1-D Convolutional Neural Network

背景

基于MD（频谱）图的人体姿态识别已经存在很多相关研究，最早人们对原始数据提取特征，然后利用机器学习方法对特征进行分类，后来又研究引入了STFT等方法利用原始数据生成频谱图，再按照机器学习的方法进行分类。

由于机器学习等传统方法需要人为手动提取特征，后来深度学习应用了进来，将频谱图视为光学图像或者序列图像输入到各种模型中进行分类，效果相比较于传统方法有了较为大幅的提升。

但是利用频谱图作为输入存在一定局限性：
（1）光学图像的像素具有很高的空间相关性，而雷达二维矩阵的像素具有很大的时间相关性。因此，将2-D矩阵视为光学图像然后使用2-D-CNN对其进行分类可能不是最佳的，而1-D-CNN通常用于处理时序信号，因此具有更好的从雷达信号中提取时间相关性的能力。
（2）一维卷积具有最低的计算复杂度，更低的参数量。
（3）频谱图可以看做是人为提取的特征，用CNN替代STFT来提取频谱图引入了学习的过程，可能具有更好的效果。

方法

在这里插入图片描述

本文网络结构如上图所示，理解起来比较简单，首先将原始的I/Q信号实数和虚数视为两个信道，输入雷达信号的STFT可以被认为是具有固定傅立叶系数的一维卷积。因此，在本文中，所提出的ID-1-D-CNN的前两个卷积层被用来代替STFT，然后文章定义了一个ID block的块，ID block的具体结构如上图所示，类似于Googlenet，在其基础上引入了DenseNet和NiN的1*1卷积，i表示总的通道数，总的通道数在不同的kernel上进行分配，三个ID block的i并不相同。

ID block具体结构：

1、受GoogLeNet的启发，在所提出的1-D-CNN中应用了初始模块技术，为了构建更宽、更深的CNN，初始模块使用多分支结构，每个分支代表不同的滤波器大小，这意味着感受野的大小不同。通过网络的训练，网络可以在初始模块中自动选择合适的滤波器大小。

2、密集连接技术(Dense net)可以解决梯度消失的问题。
Dense Net中的Concat是对通道数合并，Res Net则是做值的相加，通道数不变。Dense Net核心思想在于建立了不同层之间的连接关系，充分利用了feature，进一步减轻了梯度消失问题，加深网络不是问题，而且训练效果非常好。另外，利用bottleneck layer，Translation layer以及较小的growth rate使得网络变窄，参数减少，有效抑制了过拟合，同时计算量也减少了

3、为了进一步减少参数数量和增加网络深度，应用了NiN技术，在NiN中，特征图的通道被1×1卷积压缩，导致网络的参数量更少。

实验结果

首先看一下利用两个一维卷积和STFT处理原始雷达信号的区别，可以看出，所提出的特征图的特征图更稀疏。通常，网络可以更容易地从稀疏的输入特征图中提取高级判别特征。
在这里插入图片描述
然后是实验结果与现存的其它模型的对比，可以看出准确率有了些许提升，而参数量相比其他模型大大减少

在这里插入图片描述
下面这个则是证明了利用两个一维卷积处理原始雷达信号相比较于STFT的优越性。

（USTC求学游子著）

求学游子@

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
论文阅读笔记：Classification of Human Activity Based on Radar Signal Using 1-D Convolutional Neural Network

因此，在本文中，所提出的ID-1-D-CNN的前两个卷积层被用来代替STFT，然后文章定义了一个ID block的块，ID block的具体结构如上图所示，类似于Googlenet，在其基础上引入了DenseNet和NiN的1*1卷积，i表示总的通道数，总的通道数在不同的kernel上进行分配，三个ID block的i并不相同。因此，将2-D矩阵视为光学图像然后使用2-D-CNN对其进行分类可能不是最佳的，而1-D-CNN通常用于处理时序信号，因此具有更好的从雷达信号中提取时间相关性的能力。
复制链接

扫一扫