Classification of Human Activity Based on Radar Signal Using 1-D Convolutional Neural Network
背景
基于MD(频谱)图的人体姿态识别已经存在很多相关研究,最早人们对原始数据提取特征,然后利用机器学习方法对特征进行分类,后来又研究引入了STFT等方法利用原始数据生成频谱图,再按照机器学习的方法进行分类。
由于机器学习等传统方法需要人为手动提取特征,后来深度学习应用了进来,将频谱图视为光学图像或者序列图像输入到各种模型中进行分类,效果相比较于传统方法有了较为大幅的提升。
但是利用频谱图作为输入存在一定局限性:
(1)光学图像的像素具有很高的空间相关性,而雷达二维矩阵的像素具有很大的时间相关性。因此,将2-D矩阵视为光学图像然后使用2-D-CNN对其进行分类可能不是最佳的,而1-D-CNN通常用于处理时序信号,因此具有更好的从雷达信号中提取时间相关性的能力。
(2)一维卷积具有最低的计算复杂度,更低的参数量。
(3)频谱图可以看做是人为提取的特征,用CNN替代STFT来提取频谱图引入了学习的过程,可能具有更好的效果。
方法
本文网络结构如上图所示,理解起来比较简单,首先将原始的I/Q信号实数和虚数视为两个信道,输入雷达信号的STFT可以被认为是具有固定傅立叶系数的一维卷积。因此,在本文中,所提出的ID-1-D-CNN的前两个卷积层被用来代替STFT,然后文章定义了一个ID block的块,ID block的具体结构如上图所示,类似于Googlenet,在其基础上引入了DenseNet和NiN的1*1卷积,i表示总的通道数,总的通道数在不同的kernel上进行分配,三个ID block的i并不相同。
ID block具体结构:
1、受GoogLeNet的启发,在所提出的1-D-CNN中应用了初始模块技术,为了构建更宽、更深的CNN,初始模块使用多分支结构,每个分支代表不同的滤波器大小,这意味着感受野的大小不同。通过网络的训练,网络可以在初始模块中自动选择合适的滤波器大小。
2、密集连接技术(Dense net)可以解决梯度消失的问题。
Dense Net中的Concat是对通道数合并,Res Net则是做值的相加,通道数不变。Dense Net核心思想在于建立了不同层之间的连接关系,充分利用了feature,进一步减轻了梯度消失问题,加深网络不是问题,而且训练效果非常好。另外,利用bottleneck layer,Translation layer以及较小的growth rate使得网络变窄,参数减少,有效抑制了过拟合,同时计算量也减少了
3、为了进一步减少参数数量和增加网络深度,应用了NiN技术,在NiN中,特征图的通道被1×1卷积压缩,导致网络的参数量更少。
实验结果
首先看一下利用两个一维卷积和STFT处理原始雷达信号的区别,可以看出,所提出的特征图的特征图更稀疏。通常,网络可以更容易地从稀疏的输入特征图中提取高级判别特征。
然后是实验结果与现存的其它模型的对比,可以看出准确率有了些许提升,而参数量相比其他模型大大减少
下面这个则是证明了利用两个一维卷积处理原始雷达信号相比较于STFT的优越性。
(USTC求学游子著)