基于双胞循环神经网络的雷达捷变频行为识别

源自:系统工程与电子技术

作者:孟宪鹏  刘利民  董健 王力  胡文华

“人工智能技术与咨询”  发布

摘 要

雷达程控捷变频行为具有一定的抗窄带瞄准式干扰能力, 同时能够实现测量和动目标指示等功能, 给干扰引导带来一定的困难。对此,提出随机频率模板的方法, 对雷达程控捷变频行为进行建模, 并设计了一种双胞循环神经网络识别程控捷变频行为。仿真实验结果表明, 双胞循环神经网络能够有效识别雷达程控捷变频行为, 并以一定的概率预测未来的频率序列, 能够有效地为窄带瞄准式干扰提供引导。仿真结果也表明, 所提网络能够有效记忆和识别一组非线性时间序列。

关键词

捷变频 ; 行为识别 ; 循环神经网络 ; 记忆细胞

引 言

雷达行为是雷达在一定的场景中为实现某种目的而相应采取的一系列操作[1-4]。操作涵盖的范围包含了天线、发射机、接收机和信号处理模式等环节[5]。从电子侦察一方的角度看来, 雷达行为的表现为发射参数的变化, 脉冲体制雷达常用的参数分为脉间参数和脉内参数。脉间参数包含载频(carrier frequency, CF)、脉冲重复周期(pulse repetition interval, PRI)、到达时间(time of arrival, TOA)、到达方向(direction of arrival, DOA)和脉宽(pulse width, PW)[6]。脉内参数主要是脉冲调制类型以及对应的调制参数。脉冲调制类型主要有线性调频(linear frequency modulation, LFM)、Barker码调制、二相编码调制、Costas编码调制以及多相码调制等。不同的调制类型具有各自的优势[7-10], 雷达可以根据自身需要选择不同的调制类型, 但受限于硬件条件, 同一部雷达一般仅能选择有限数量的调制类型。雷达抗干扰时可以选择多种不同的发射参数, 其中常见而且比较有效的方法是脉间捷变频[11-12]。脉间捷变并非毫无目的地变化, 而是带有很强的目的性[13-15], 雷达根据不同的场景使用不同的捷变规律[16-19]。常用的捷变方式有任意固定频率、小范围内快速捷变、在整个调谐范围内快速随机捷变、程控频率捷变和自适应频率捷变[20]。当前, 全相参捷变频雷达可以在大带宽内快速随机捷变, 如AN/APG-81型有源相控阵雷达[21], 干扰机难以跟踪其频点。

为了提高干扰效率, 干扰机需要预测雷达的频点, 进而实施窄带瞄准式干扰或者欺骗干扰。目前, 在雷达和通信电子战领域, 针对跳频规律的预测研究较多[22-27], 例如针对伪随机跳频序列预测有3种非线性模型: Bernstein多项式预测器、支持向量机(support vector machine, SVM)预测器[28]和径向基(radial basis function, RBF)神经网络非线性预测器[29]。李文情[30]采用时频图的方法对跳频信号进行检测。Li[31]设计了堆叠长短期记忆(long short-term memory, LSTM)网络对基于m序列的伪随机频率序列进行预测。张家树[32]基于混沌理论论述了混沌捷变频伪随机序列的短期可预测性, 如m序列、RS(Reed-Solomon)跳频码和基于Logistic-Kent映射设计的跳频码, 并针对具有混沌特性的捷变频序列, 提出了二阶Volterra自适应预测法和基于非线性函数变换的乘积耦合型自适应预测器。以上方法主要以伪随机捷变频频率序列为研究对象, 建立模型做短期行为预测, 而针对程控捷变频预测的研究较少。

本文针对雷达捷变频行为中的任意固定频率和程控捷变频模式的识别进行研究, 基于非线性时间序列建模的思想, 将频率序列从低维空间变换到高维空间, 利用数据驱动的方法, 采用记忆存储的思想, 设计具有状态记忆功能的神经网络, 找到高维空间中的函数映射的近似, 同时存储每一种程控捷变模式, 用于频率序列的在线识别。

1 程控捷变频行为建模

在仅仅考虑抗有源干扰的情况下, 雷达可以选择伪随机捷变频的方式发射波形, 虽然全相参捷变频雷达可以实现测速、测距和成像功能, 然而其实现较为复杂, 研究起步晚, 所以装备数量较少。程控捷变频可以按照预先设定的频率点进行捷变频, 信号处理相对容易, 雷达可以预先设定多个频点, 形成多个组合, 如阶梯步进频编码和Costas编码就是一组具有优良模糊函数特性的频率编码[7, 20]。假设雷达从一个有限数量编码集合中选择一个编码调制发射信号[8-9], 且对编码集合的任一子集的编码没有使用偏好, 那么可以使用均匀分布对编码使用规律进行建模。

1.1 频率编码模型

频率捷变信号模型可以表示为

图片

(1)

式中:u(t)表示信号的复包络; 

图片

表示噪声; 

图片

和tm分别表示快时间和慢时间,

图片

表示脉冲重复周期;fm表示第m个脉冲的载频, 可以表示为

图片

(2)

式中: M表示累积脉冲数量;a(m)表示随机整数, 也叫频率调制编码, 取值范围为0到N-1;N表示当前编码所含频点的数量, N>M;Δf表示相邻载频间隔。一般而言, 为增强脉冲间正交性, 令

图片

(3)

式中:k是正整数;Tp是脉冲的宽度[33]。

Costas编码是一种常用的频率编码, 具有较好的测速和测距性能。Costas编码定义在有限数量频点集合F上, 假设雷达的频点数为Nf, 编码中元素的数量是该编码的阶数NCA, NCA≤Nf。将集合中元素按照Costas编码定义约束排列, 利用算法即可生成该阶数NCAi下的编码集合CCAi, 其中i=1, 2, …, Nf。每个阶数下的编码数量是有限的, 目前公开的数据集已经能够生成阶数为1 030的Costas编码[9]。因此, 可用的Costas编码数量也是有限的。一个10阶Costas编码频点捷变示意图如图 1所示, 该编码序列是{2, 4, 8, 5, 10, 9, 7, 3, 6, 1}。令cCAi表示阶数NCAi下的一个Costas编码序列, 并且

图片

(4)

图片

图1   一个10阶Costas编码的频点分布图

图片

(5)

将式(5)代入式(2), 可得雷达使用编码cCAi时的载频序列:

图片

(6)

1.2 雷达捷变频行为建模

当雷达工作在程控捷变频模式时, 其使用的频率调制编码数量是有限的。基于这个事实, 从干扰方的角度提出随机频率模板的方法对雷达程控捷变频行为进行建模。假设干扰方可以截获所有的发射脉冲, 并且所截获的频点序列包含了雷达所有的频率调制编码, 那么可以定义一个编码集合描述所截获的编码集合, 即

图片

(7)

式中:ci 表示第i个频率编码;Nc是频率编码数量。令

图片

(8)

式中:

图片

表示编码ci的第j个频点; F是雷达所用频点集合。由于干扰方无法知晓雷达当前的工作模式, 也就无法确定雷达使用频率编码的规律, 因此可以假设雷达以均匀分布使用所有可截获的频率编码, 每个频率编码出现的概率为1/Nc, 定义截获的频率编码序列为

图片

(9)

式中:ok为观测序列s中的某个频率编码;L是观测得到的编码数量。

由于雷达可用编码数量是有限的, 可以假设雷达反复使用编码, 则干扰方会反复观测到同一编码。理想情况下, 当L→∞时, 干扰方会观测到足够数量的频率编码, 每个频率编码对应一种捷变频行为。这里将任意固定频率的编码视为一种特殊的捷变频行为: 在数学上任意固定频率的相邻载频的差值为0。在长期观测雷达反复出现的行为基础上, 希望利用数据驱动的方法识别雷达不同的捷变频行为, 并能预测该行为模式下的频点序列。

2 循环神经网络

循环神经网络(recurrent neural network, RNN)可以用来处理时间序列数据。随着计算机计算能力的发展和大数据的积累, RNN被广泛应用于自然语言处理、语音识别和机器视觉领域[34-38]。这种网络的设计包含了参数共享的思想: 假设序列的未来样本可以由历史样本计算得到, 那么在序列的任何一个片段, 计算未来样本所需要的映射需要共享相同的参数。同时,RNN也采用了非线性空间变换的思想, 将一维的时间序列样本映射到高维空间, 并成为隐状态, 在这个隐状态空间求出能够共享参数的映射。即

图片

(10)

图片

(11)

式中:h(t)为t时刻的隐状态, 相当于历史输入的在高维空间的有损摘要; g(t)为t时刻的序列一步预测函数; f(t), f(t-1), f(t-2), …, f(2), f(1)为从时刻1到时刻t的历史观测频率序列; G为共享相同参数θ的函数, 该函数可以利用h(t-1)和t时刻的输入f(t)计算得到t+1时刻的样本f(t+1); Γ为含有共享参数λ的函数, 该函数可以将t+1时刻以前的输入序列映射为一个隐状态h(t)。

RNN的计算过程如图 2所示[34, 39], 图中输入频点f(t)转变为独热向量f(t), U、V、W为变换矩阵, o(t)为t时刻的预测输出, Loss为损失函数, 计算公式为

图片

(12)

图片

图2   RNN的计算图

式中: Active(·)为非线性激活函数, 此处使用双曲正切函数tanh(x)。利用批量处理随机梯度下降的方法, 调整网络参数, 使得在观测的数据集上有:

图片

(13)

式中:Loss取交叉熵损失函数。经过数值计算, 得到神经网络的共享参数U、V、W, 由于随机梯度下降方法无法保证网络参数能收敛到全局最优解, 因此损失函数可能只是在某一个局部极小值处, 不一定达到全局最小值。

在训练过程中, 需要设定序列预测步数Nstep, Nstep设定过大, 会超出很多频率编码的长度, 导致训练过程难以收敛; Nstep设定太小, 又难以捕捉长序列的规律。由于假设雷达使用的频率编码长短不一, 设定短一些相对较好, 原因是长序列可以视为由多个短序列相连接而成。RNN不会因为Nstep设定小于较大频率编码长度而无法完成训练, 网络可以将长编码按照多个长度为Nstep的编码进行训练。所以,仅仅需要根据干扰引导的需求和雷达跳频速度来设定频率编码预测长度。

3   双胞RNN的设计

虽然隐状态h(t)可以保存历史输入的一个摘要, 但是随着输入序列的增加, 距离当前时刻较远的输入就会被“遗忘”。为了保留长期记忆, 有学者提出了LSTM模型[34, 40]。该模型引入了记忆单元, 能够根据输入频率序列上下文动态调整时间积累的尺度,这不仅需要单步预测, 还需要具备一定的多步预测能力, 这就需要RNN能够根据频点序列的前几个输入判断当前序列所属的频率编码。为此, 本文提出了双胞RNN(bi-cell RNN, BRNN), 用以提高预测能力。其网络结构如图 3所示[39]。其中,图 3(a)是LSTM单元结构图, 单独的LSTM可以由输入控制输入门和遗忘门来对历史序列进行动态截取, 而不需要像传统的自回归模型那样建立固定的线性关系。这种设计使得LSTM可以灵活地控制在下次预测时所采用的历史信息的长度。但是, 单独的LSTM单元也有局限, 就是容易产生“偏见”, 即一个记忆单元根据历史输入序列生成的有损摘要可能有很大的信息损失, 从而导致无法根据这个有损摘要判断当前的上下文环境。因此,添加了一个并列的LSTM单元, 由两个记忆单元共同预测, 再对两个预测结果加权, 得到实际的预测, 其结构如图 3(b)所示。

图片

图3   BRNN的组成

一个LSTM的计算过程[39]如下:

图片

(14)

图片

(15)

图片

(16)

图片

(17)

图片

(18)

图片

(19)

式中: σ(x)表示非线性激活函数,σ(x)=1/(1+exp(-x));⊙表示逐元素相乘。LSTM单元以t时刻侦测频点f(t)、t-1时刻的隐状态h(t-1)和记忆单元S(t-1)为输入, gi(t)为输入门, 控制短期输入的影响; gf(t)为遗忘门, 用于控制长期输入的影响; go(t)为输出门; 

图片

为t时刻的内部记忆, 

图片

分别是对应的输入权重和自循环权重, bi、bf、bo、bS分别是对应的偏置向量。输出记忆S(t)由输入记忆和内部记忆加权相加得到, 输出隐状态h(t)由输出门控制输出记忆决定。

内部记忆状态可以综合短期记忆和长期记忆的信息, 从而更新记忆。但一个LSTM只有一个内部记忆状态, 难以应对多种上下文类型, 例如上下文有测频误差时, 单独的记忆单元容易发生误判。因此, 设计了BRNN, 如图 3(b)所示, 该网络包含了两个LSTM单元, 共有两个内部记忆单元, 每个LSTM单元接收t-1时刻的各自的隐状态h(t-1)和输出记忆单元S(t-1), 分别输出o1(t)和o2(t), 其中:

图片

(20)

经过全连接层线性变换后, 再由SoftMax函数将向量转化为类似概率分布的向量[39], 得到预测结果o(t), 即

图片

(21)

式中: W是全连接层矩阵的参数。该参数的作用是综合两个记忆细胞单元的判断, 防止发生“偏见”。两个记忆细胞单元属于并列结构, 由于初始值为随机数, 在训练的过程中, 两个记忆细胞单元的输出分布并不完全相同, 且对历史输入都有独立的有损摘要, 所以设立两个细胞的加权输出可以得到稳健的预测。预测频点为

图片

(22)

式中: Index(·)为取下标函数; max(·)为取最大值函数。

4 实验设置和评价指标

训练集可选频点数量为25, 共选择了36个Costas频率编码和5个固定频率编码, 最短的频率编码长度为8, 最长的频率编码为16。训练集由随机选择的频率编码前后连接构成, 每个编码被选择的概率相等, 训练集有1 000个编码。用相同的方法生成测试集, 编码的数量为200, 在蒙特卡罗仿真过程中, 每次测试都重新生成测试集。

训练步数Nstep指的是模型每次迭代训练过程中选取的训练数据的长度, 不同的取值可能会对模型精度有影响, 下文会讨论这一点。设置批处理大小为50, 训练次数设为300, 学习率设为0.01, 蒙特卡罗仿真次数为1 000次。

时间序列预测有多种评价指标, 在频率预测应用中, 典型的指标有均方误差、相对均方误差、相关系数和相对根均方误差。但这些评价指标无法表征频率编码识别的动态过程, 因此本文提出的指标可以表征预测能力随着输入频点增多而变化的规律。即在给定t时刻输入频率样本点的条件下, 计算该时刻单步平均预测正确率p1t和K步预测正确率pKt, 其中K>1, 计算方法为

图片

(23)

图片

(24)

每次仿真会输出两种正确率曲线, 利用1 000次仿真结果, 分别求取两种预测正确率的均值, 同时求出预测结果的方差。用以表征预测正确率随时间推移的变化趋势和捷变频行为识别能力,即预测正确率随时间推移趋于平稳, 说明预测模型能够以一定概率正确预测未来的频点。方差趋于0, 说明该模型能够以一定概率稳定识别当前频率序列所属的捷变频编码。

5 结果与讨论

5.1 训练参数与预测平均正确率的关系

BRNN方法预测平均正确率可以收敛, 训练步数Nstep会影响正确率, Nstep越大, 非线性变换函数越复杂, 模型拟合难度越大; Nstep小, 模型难以捕捉到频率编码变化的规律。在雷达发射编码未知的条件下, 需要根据训练集调整Nstep, BRNN方法的预测正确率结果如图 4和表 1所示。

图片

图4   预测正确率曲线

图片

表1   不同Nstep时的预测平均正确率

图 4是Nstep设为8时的预测正确率曲线, 从图 4(a)中可以看出, 单步预测正确率均值趋于平稳, 平均正确率为79.34%, 方差逐渐趋于0, 可见单步预测时捷变频预测能力较好。图 4(b)表明多步预测时pKt逐渐收敛到平均值, 方差逐渐收敛到0, 即每个时刻做多步预测的正确率逐渐稳定。但从时间平均上看, K为8时平均正确率达到54.93%, 表示做8步频点预测时, 可以正确预测其中约至少50%的频点。

表 1是不同Nstep条件下的预测平均正确率, 由于相参雷达一个相干处理间隔的脉冲至少为8, 因而训练步数选取的是从8到16之间的偶数。选择步数太大, 则明显超过了很多频率编码的长度, 导致无意义的训练结果。表 1中,单步预测正确率在79%上下波动, 8步预测正确率在54%上下波动, 可见在8到16这个区间范围内, 选取Nstep不会对预测正确率有明显的影响。

5.2 不同方法的平均单步预测正确率对比

传统的捷变频序列预测方法主要有反向传播(back propagation, BP)神经网络、RBF神经网络、二阶Volterra自适应滤波器和LSTM方法。前3种一般应用于混沌时间序列的建模, 需要精细调整建模参数, LSTM是RNN方法的一种[41], BP方法、RBF方法和Volterra方法模型在实验数据上进行多步预测时模型失效。因此,比较指标仅设定为单步预测的平均正确率,结果如表 2所示。

图片

表2   不同方法单步预测平均正确率

表 2中, 参考方法的参数如下: BP神经网络采用4个隐藏层, 每一层有10个, 分别为输入层、2个隐藏层和输出层, 2个隐藏层的节点数量均设为20;RBF神经网络采用30个隐藏节点, 利用普通最小二乘(ordinary least square, OLS)算法进行训练, 输入层和输出层的节点数量都是1;Volterra自适应滤波器采用2阶Volterra核进行非线性扩展, 再利用有限冲击响应的时间正交算法确定非线性部分的系数。LSTM的网络结构如图 3(a)所示。

BP神经网络、RBF神经网络和Voltrra方法都难以对程控捷变频序列进行预测。虽然这3种方法都采用了非线性变换的思想, 但建立的模型并未对频率编码进行识别。混沌序列的预测可以利用相空间重构的方法, m序列和RS序列的预测可以用BP神经网络、RBF神经网络进行拟合, 其思想采用了单步预测思想, 即t时刻的频点值与t-1时刻的值有关。二阶Volterra自适应滤波器将t时刻前的一段历史序列进行非线性变换, 得到高维空间特征, 再用线性最小二乘滤波器求取最优权值, 运算量大, 不具有通用性, 需要手动调整超参数。而LSTM模型和BRNN模型同为RNN模型, LSTM相比BRNN在无测频噪声条件下的预测正确率约高1.4%, 可能原因是理想条件下单LSTM单元比双记忆单元判断能力更强, 不会出现双记忆单元加权“权衡”的现象。

5.3 无噪声小样本条件下的性能

干扰方的接收机存在测频误差, 由于窄带瞄准式干扰具有一定的带宽, 干扰方可以以瞬时干扰带宽为间隔将雷达的捷变频范围划分为若干离散的频段。这样, 即便存在测频误差, 只要偏差在干扰带宽内, 就可以认为是有效的干扰引导频率。然而, 总有测频误差出现较大偏差的情况发生, 本文称其为测频噪声, 当测频序列不含测频噪声时, 在不同训练样本数量Ntrain下的预测平均正确率如表 3所示。

图片

表3   不同训练样本数量下的预测平均正确率

从表 3可以看出, 随着训练样本数量的减少, 单步预测和8步预测的平均正确率都降低, 但随着样本数量的增加, 预测正确率的增长逐渐变得平缓, 说明模型在样本数量到达一个阈值后, 达到了预测能力的上限。本文使用的训练集的频率编码数量是41, 样本数量越大, 意味着每个频率编码重复次数越多。当样本数量达到6 307时, 由于编码出现的概率服从均匀分布, 平均每个编码样本出现了约15次。在这种条件下, 模型的学习能力趋向饱和, 因此预测正确率趋向稳定值, 饱和条件下的样本重复次数不仅和模型有关, 也和频率编码集合有关。但由于不能假设编码集合完全已知, 只能假设干扰方能够侦测到足够数量的频点, 以及频率编码出现概率服从均匀分布, 因此只能根据实验估计模型饱和时所能达到的预测平均正确率。

5.4 含测频噪声条件下的性能

下面讨论LSTM模型和BRNN模型在测试集频率序列含有测频噪声条件下的预测正确率。假设测频误差范围在单位Δf内, 用±1表示, 每个频点误差出现的概率为Perr。两种模型的预测结果如图 5所示。

图片

图5   平均预测正确率随测频误差概率的变化曲线

从图 5可以看出, 随着测频误差概率Perr的增大, 两个模型的平均预测正确率都在下降。BRNN的预测平均正确率要高于LSTM模型, 在测频误差概率为0.1时, 无论对于单步和8步预测平均正确率, 两种模型性能相差约3%。但随着测频误差概率的增大, 两个模型之间的性能趋同, 当测频误差概率为0.5时, BRNN的单步预测平均正确率为20.09%, 而LSTM的预测平均正确率为19.60%;8步预测平均正确率分别为15.65%和15.01%, 性能相差在1%以内。BRNN总是比LSTM抗测频误差能力强,这说明双胞记忆的结构要优于单独的记忆单元。

5.5 含测频噪声小样本条件下的性能

最后, 本文探讨在有测频噪声的条件下, 训练样本数量对预测正确率的影响。设定Perr为0.1, 噪声幅度为1, 比较了5种训练样本数量条件下两个模型的平均预测正确率, 结果如图 6所示。

图片

图6   平均预测正确率随训练样本数的变化曲线

从图 6可以看出, 在含噪声条件下, 不论是单步预测或是8步预测, 训练样本数量越多, 模型的平均预测正确率越高, 且BRNN的表现始终好于LSTM。给定10 510个训练样本, BRNN的单步预测正确率能达到58.13%, 8步预测的正确率达到40.08%, 而LSTM的两种预测正确率分别为55.11%和37.81%。随着训练样本数量的减少, 两种模型的性能差别也在减小, 但样本数量低于4 204时, LSTM比BRNN的性能下降更快。以上结果说明: BRNN在有测频噪声的条件下性能好于LSTM, 双胞记忆的效果要好于单独的记忆单元, 抗测频误差的能力更强。

6  结 论

针对雷达程控捷变频现象, 本文提出了雷达程控捷变频行为的模型, 将捷变频行为识别问题转化为频率编码的识别问题, 采用非线性变换和维度变换的思想, 利用LSTM单元的优势设计了BRNN, 并提出了单步预测正确率和多步预测正确率的评估指标, 讨论了模型超参数、训练样本数量以及测频噪声对模型性能的影响。对比其他方法可知, BRNN能够有效识别雷达程控捷变频率编码, 识别能力要优于传统的频率预测方法, 在有测频噪声的条件下, 识别效果好于LSTM。在有限数量的频率编码集上, RNN的记忆单元可以根据频率编码的初始频点识别当前编码, 并能以一定的正确率预测下一个频点或者多个频点。

程控捷变频的频率编码集合属于有限个非线性时间序列集合的一种。本文研究结果表明, 在输入时间序列是由该集合中的序列随机组合而成的条件下, BRNN模型可以根据时间序列的初始输入“激活”该时间序列的有损摘要, 进而判断当前时刻输入所处的时间序列。该结果也说明, BRNN可以将一维时间序列映射到高维空间, 并在高维空间找到含有共享参数的映射函数, 效果优于手动提取高维特征的方法。

声明:公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨,并不意味着支持其观点或证实其内容的真实性。版权归原作者所有,如转载稿涉及版权等问题,请立即联系我们删除。

“人工智能技术与咨询”  发布

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值