基于多目标进化算法的防空导弹武器目标分配

源自:系统仿真学报

作者:孙昕  邢立宁  王锐 王凌  石建迈  罗天羽

注:若出现无法显示完全的情况,可 V  搜索“人工智能技术与咨询”查看完整文章

摘 要

有效的武器目标分配(weapon-target assignment,WTA)方法对减少作战损失,提高防御效果具有重要意义。针对防空资源分配问题建立合理的数学模型,以最大化目标毁伤效能和最小化雷达资源消耗为优化目标,同时考虑雷达通道数上限等多个约束,在基于分解的多目标进化算法(multi-objective evolutionary algorithm based on decomposition,MOEA/D)基础上进行改进,种群进化过程中自适应调整交叉与变异的概率以提高个体的质量,最终得到一组可供决策者使用的最优解集。实验结果表明:与其他多目标进化算法相比,该算法能得到适应度更高且分布性良好的结果,能够为防空导弹武器目标分配问题提供可行方案。

关键词

武器目标分配 ; 多目标进化算法 ; 自适应参数 ; 防空导弹

引言

现代战争中,“饱和攻击战术”是一种新兴的战术,该战术可以在短时间内发射大量的导弹以摧毁重要目标。因此,很多国家提出了对应的“抗饱和攻击”的防御措施,“抗饱和攻击”需要通过战场信息制定出对来袭目标的打击方案,决策者根据蓝方武器的侦测性能以及打击性能、来袭目标的威胁程度、战场形式等因素,将蓝方武器按照特定的原则分配给来袭目标,从而保护蓝方战场安全,以实现合理的防御效果,这是一类武器目标分配问题。在其他作战场景下,决策者一般考虑作战效能和导弹资源消耗(成本),但在饱和攻击作战场景下,所有导弹资源都需要投入作战,导弹资源消耗不再成为优化目标,而是作战约束。防空雷达在作战时的地位十分重要,在拦截来袭导弹的过程中,过长的雷达开机时间(资源消耗)会增大雷达遭受红方反辐射导弹攻击的风险,一旦其被红方攻击破坏,整个防空系统将丧失防御和定位的功能,因此,在作战过程中还需尽可能减少雷达的开机时间。

武器目标分配是NP完全问题[1],往往存在高维、非线性、多极小、强约束、不确定、多目标等诸多复杂性,且随着规模的增长,求解难度呈指数增长。传统的方法如梯度下降法[2]、启发式算法[3]、博弈论[4]等在规模较小的武器目标分配问题上能够实现求解。文献[5]将该问题表示为二进制的整数线性规划模型,并使用列枚举和约束技术进行求解。文献[6]考虑了发射器和来袭目标的航向误差来提高杀伤概率。文献[7]建立了一个二元非线性整数规划模型,并采用自适应学习策略来提高搜索能力,但随着问题规模的增加,这些方法难以在短时间内找到合适的解决方案,且容易陷入局部最优。为了解决上述问题,进化算法被广泛应用于各类包含复杂约束的优化调度问题[8-10],具有全局搜索能力强、收敛速度快、可以实现并行操作等优点。许多学者对进化算法做出了不同的改进以适用于不同的问题,以平衡多样性和收敛性[11]。文献[12]提出了一种改进的人工蜂群算法,通过得到带有不同分组约束的解来实现多个目标的拦截。文献[13]设计了一种改进蚁群算法来求解武器目标分配问题,该算法同时改进了信息素的更新策略、浓度区间,并加入了精英个体指导种群进化的方向。文献[14]在粒子群算法中引入了速度最大值更新方式,加强种群在迭代前期的全局搜索能力和后期的收敛能力。文献[15]将模拟退火算法和禁忌搜索算法结合,重新设计了威胁函数,在搜索效率上有一定的提升。以上文献仅考虑了最大化毁伤效能,但在实际的武器目标分配问题中往往还要考虑蓝方的资源消耗与重要设备被攻击的风险,因此,许多学者将该问题转化为含有约束的多目标优化问题。多目标进化算法(multi-objective evolutionary algorithm, MOEA)可以对多目标优化问题进行求解,并得到一组在Pareto前沿面的解集,以供决策者参考[16]。文献[17]在舰艇武器目标分配问题上,采用了NSGA-II算法来得到非支配解集。文献[18]设计了一种改进的NSGA-III算法,该算法将参考点的聚类中心代替原参考点,以提高收敛速度,但容易收敛到局部极值。文献[19]在MOEA/D(MOEA based on decomposition)算法的基础上,提出了一种新的启发式初始化种群方法,用于求解不确定条件的武器目标分配问题。文献[20]提出了一种多目标粒子群进化算法,将种群分为多个子种群,并且协同进化,但每个从属子种群只能优化单个目标函数,因此不能得到适用于多目标武器目标分配问题的解。文献[21]将武器可靠性和任务可靠性作为目标函数,并自适应调整目标权重。

综上所述,针对多目标武器目标分配问题的研究仍处于起步阶段,相比单目标武器目标分配问题,多目标武器目标分配问题需要处理多个约束,求解难度更大,局部最优解容易受算法性能的约束,且研究较少。为了解决以上问题,本文针对防空导弹目标武器分配问题,建立数学模型,同时优化目标毁伤效能和雷达资源消耗这2个互相冲突的目标函数,并在基于分解的多目标进化算法的框架上进行改进,自适应改变种群中交叉和变异的概率,兼顾全局搜索能力和种群的稳定性,最后得到一组互不支配的Pareto解集。

1 问题分析与建模

1.1 问题分析

本文研究饱和攻击作战场景下的多目标优化,主要用于防空反导系统的论证与分析、在饱和攻击条件下的防空反导系统的能力边界、综合能力分析,以及完善战前工作的优化部署。本文构建了空地攻防对抗的战场模型,红方作战设备包括若干空袭导弹,蓝方作战设备包括若干雷达和发射车,蓝方根据当前空袭导弹的观测信息和轨迹预测结果对其进行拦截。本文涉及的具体作战场景:在特定的作战范围内,某一时刻出现若干红方的来袭导弹,并且从不同的位置和角度出现,蓝方存在一个雷达侦测所有来袭导弹的全部飞行过程。蓝方需要结合该作战范围内的探测资源(雷达)和火力资源(发射车),对每一个来袭导弹分配对应的雷达和发射车的资源组合。不同的雷达和发射车的资源组合决定了不同的打击范围和命中概率,对于每一个来袭导弹,将其飞行轨迹分为多个离散的等距时间段。该问题包括来袭导弹集合M、发射车集合L、雷达集合R和发射车发射导弹时刻集合T。其中,m∈M ,属性包括来袭目标的当前位置,速度以及飞行方向;l∈L ,属性包括发射车的位置,以及配备的导弹类型;r∈R ,属性包括雷达的位置,以及雷达的类型;𝑇={1,2,⋯,𝑡max},tmax 为来袭目标飞行最久的时间。

如图1所示,来袭目标为绿色三角,红色虚线为其未来的飞行轨迹,实心圆圈为雷达,扇形代表每个雷达不同的侦测范围,方块为发射车,虚线圆为每个发射车不同的打击范围。

图片

图1   拦截示意图

为了简化分析,该问题做出如下假设:

  • (1) 红方来袭导弹和蓝方拦截导弹飞行的速度不变,且飞行轨迹都为直线;

  • (2) 蓝方每一个发射车都配置相同类型的导弹,且对每一个来袭目标发射一枚或多枚拦截导弹;

  • (3) 蓝方在拦截导弹发射到击中目标的每个时刻,只有一部雷达跟踪该拦截导弹所要拦截的来袭目标。

1.2 问题建模

基于以上防空导弹武器目标分配问题的描述,该问题的输入为每个来袭目标的当前位置、速度、飞行角度,输出为对每个来袭目标分配的雷达、发射车和发射车发射导弹的时刻。

考虑导弹的命中概率,第一个目标函数为最大化总体目标毁伤效能:

图片

(1)

式中:|M| 为来袭导弹总数;Vm 为来袭导弹m的价值;n为对同一个来袭导弹蓝方发射的最大导弹数;|L| 为发射车总数;|R| 为雷达总数;xm,l,r,t=1 ,代表来袭导弹m的防御方案为发射车l在时刻t发射导弹,且飞行最后阶段被雷达r观测,否则,xm,l,r,t =0;pm,l,r,t 为当前方案的命中概率。

为了方便计算,对第一个目标函数求最小化:

图片

(2)

除了满足最大化毁伤效能的需要之外,还需要考虑拦截成本,因此,第二个目标函数考虑最小化雷达开机时间,即雷达的资源消耗。雷达追踪每个目标的开机时间与每个蓝方拦截导弹从发射到命中的时间相等:

图片

(3)

式中:α为归一化系数,可以使2个目标函数保持在1个数量级,使实验效果更加直观,Pareto解集更易于观察,α的取值与对每个目标发射导弹的上限有关,在本文中α=20;

图片

为发射车l对来袭目标m发射的第p枚导弹的打击时刻;

图片

为发射车l对来袭目标m发射的第p枚导弹的命中时刻。

为简化该问题,本文考虑同时对所有来袭目标做单次决策,具体约束条件如下。

对每个目标发射的导弹总数不能超过上限:

图片

(4)

式中:pm,l,t 为时刻t发射车对目标m发射的导弹数量;qmax 为每个来袭目标发射导弹的上限。

每个发射车发射的导弹总数不能超过发射车配备的导弹数:

图片

(5)

式中:θm,l,t 为时刻t发射车l发射的导弹数量;θmax 为每个导弹车配备的导弹总数。

对每个来袭目标发射的相邻导弹的命中时间间隔小于等于最大时间间距Δt ,以实现集火攻击:

图片

(6)

式中:

图片

为导弹p命中来袭目标m的时刻。

每个雷达在任意时刻所使用的通道数不能超过上限:

图片

(7)

式中:当目标m在时刻t被雷达r跟踪时,ym,r,t=1 ,否则,ym,r,t=0 ;cm,r 为目标m占用雷达r的通道数;Cr 为雷达r的通道数上限。

每个来袭目标在被打击车命中前10 s的跟踪雷达不切换,以保证对制导产生干扰:

图片

(8)

最多只有一部使用相同频率资源的雷达保持开机状态:

图片

(9)

式中:rf,t 为在时刻t使用频率资源f的雷达数量;F为所有可用的频率资源集合。

本文所研究的防空导弹目标武器分配问题为离散问题,存在多个强约束,需要优化多个相互冲突的目标,且决策变量包含3种不同类型的信息。因此,传统的方法难以在较短时间进行高效的求解,本文采用多目标进化算法来求解防空导弹目标武器分配问题。

2 求解方法分析及设计

防空导弹武器目标分配问题是典型的多目标优化问题,MOEA/D算法[22]是一种经典的求解多目标优化问题的算法,该算法将多目标优化问题转化为多个单目标优化问题,同时对这些单目标优化问题进行求解,且相邻单目标优化问题有相似的权重,因此,在处理这些单目标优化问题时,只需使用该问题邻域内的信息,降低了算法的计算复杂度。本文在MOEA/D算法的基础上,修改了种群中交叉和变异的概率,对防空导弹目标武器分配问题进行求解。图2为算法的具体流程,首先,对来袭目标进行紧急程度排序,来袭目标到达蓝方阵地的剩余时间越短,代表该任务越紧急,需要优先对这类来袭目标分配资源。其次,判断每个来袭目标分配的资源是否满足约束,在该过程中,算法根据任务紧急程度进行降序判断,因此,能尽可能保证紧急程度高的来袭目标满足约束。最后,在种群进化的过程中,自适应改变每个个体需要交叉和变异的基因概率,该数值为个体中每个来袭目标需要进行分配资源改变的概率,可以保证进化过程中蓝方资源分配的随机性与稳定性,同时兼顾了全局搜索能力。

图片

图2   算法流程图

2.1 个体编码与初始化

种群的初始化过程中,根据雷达的位置、类型、侦察范围、侦察角度和发射车的位置、类型、拦截范围,以及导弹速度等信息判断该作战场景下的可侦察范围与拦截范围。根据计算出的作战场景信息,结合不同的发射时间可以得到每个来袭目标的拦截资源分配方案,每种拦截资源分配方案包括发射车、雷达和发射车发射导弹的时刻,不同的组合决定了对该目标的命中概率。

个体编码方式对算法的求解过程起到关键作用,如果使用0-1编码方式,不可行解数量较多,且难以修改,本文采用十进制的编码方式,一个随机的染色体编码可以表示为

图片

(10)

染色体长度为来袭目标个数,以来袭目标数为5且每个来袭目标制导1枚导弹为例,个体编码示意图如图3所示,每个来袭目标的不同方案编码代表拦截方案中不同的雷达与发射车的组合,以及发射车发射导弹的时间,来袭目标的剩余飞行时间越短,代表该目标优先级越高,在图中来袭目标紧急程度降序排列为1、2、4、5、3。

图片

图3   个体编码示意图

在判断是否满足约束的过程中,首先对来袭目标1进行资源分配,如果满足约束,则将方案10对应的雷达和发射车的资源分配给目标1,否则该资源将保留。然后将来袭目标的方案2对应的雷达和发射车资源进行分配并判断约束,以此类推直到所有来袭目标的资源均分配结束。

传统的初始化方法采用锦标赛算法,但由于不同来袭目标的分配资源的组合可能会造成不同的约束,因此,不代表命中概率越大该资源分配方案越合理。本文对命中概率>0的方案均视为同等的可供选择的解决方案,在初始化过程中采用随机向量的方式,直到所有的来袭目标均被分配资源。

2.2 MOEA/D算法

针对不同的多目标优化问题,对目标函数的分解方式影响算法的性能,由于防空导弹目标武器分配问题是离散的,不能判断Pareto前沿面的凹凸性,本文采用切比雪夫法构造函数,切比雪夫法计算式为

图片

(11)

式中:zi 为第i个目标函数的参考点。

MOEA/D算法在多目标优化领域受到青睐,该算法将多目标优化问题转化为若干个单目标优化问题,在每个单目标优化问题上的权重都有所不同,该算法有十分优秀的搜索性能,且不依赖于问题的具体特征,具体步骤如下。

  • step 1:在目标空间中,分解产生和种群大小相同个数的权重向量λ1,λ2,⋯,λN ;

  • step 2:计算权重向量间的欧氏距离,并根据欧式距离为每个权重向量 i 分配T个邻居集合B(i)=(i1,i2,⋯,iT),∀i=1,2,⋯,N;

  • step 3:计算参考点z=(z1,z2,⋯,zm)T,参考点的大小为每个目标函数在种群中的最小值 𝑧𝑗=min𝑓𝑗(𝑥𝑖);

  • step 4:对于每个权重向量 i,从邻域 𝐵(𝑖)中随机挑选2个邻居进行交叉变异操作,产生新个体 y;

  • step 5:如果g(y|λj,z)≤g(xj|λj,z) ,则更新个体xj=y ;

  • step 6:满足终止条件时,输出最终的Pareto解集,否则,跳转到step 2继续循环。

2.3 自适应多目标进化算法

传统的进化算法中,交叉和变异的概率参数都是固定不变的,而面对不同的优化问题,不同的参数和算子对算法性能有着至关重要的影响[23],甚至在同一优化问题中,该参数在种群进化的早期和后期,都会对算法产生一定的影响。目前,自适应进化算法已在其他优化问题中表现出优秀的性能[24],本文将种群中个体交叉和变异的概率参数调整为随迭代次数而动态变化的参数:

图片

(12)

式中:g为种群当前迭代次数;G为最大迭代次数;𝜂为概率控制参数;C0 和M0 分别为第一代个体中需要交叉和变异的概率。

2.4 交叉变异策略

假设 x 和 y 是随机选取的2个要交叉的个体,交叉操作为

图片

(13)

式中:xi,n,j 为个体 x 中对第i个来袭目标的第n枚导弹的分配方案j;yi,n,k 为个体 y 中对第i个来袭目标的第n枚导弹的分配方案k。对于个体 x 中的每个来袭目标的资源分配方案,都独立判断是否要进行交叉操作。

假设 x 是要进行变异操作的个体,变异操作为

图片

(14)

式中:jrand 为区间[1, D]中的一个随机整数,D表示染色体的维度,在本文中表示对第i个来袭目标的可选资源分配方案总数。对于个体 x 中的每个来袭目标的资源分配方案,都独立判断是否要进行变异操作。

图4为以来袭目标数60为例,交叉和变异概率随迭代次数的变化。在进化算法的迭代早期,需要交叉的基因概率较小,因此,算法收敛速度加快,而需要变异的基因概率较大,可以兼顾算法的全局搜索能力。在进化算法的迭代后期,需要交叉的基因概率变大,算法分享个体间信息的能力得到了加强,而需要变异的基因概率变小,保证了种群中信息的稳定性。

图片

图4   交叉和变异概率

3 实验与分析

本文对不同场景与规模下的防空导弹目标武器分配进行求解,所有实验均使用MATLAB R2021b在Intel®、Core™、i5-10300H CPU 2.5 GHz、16 GB DDR3 RAM、Microsoft®Windows 10 Home 操作系统的PC上模拟。

3.1 实验参数设定

基于改进MOEA/D算法的防空导弹目标武器分配方法的参数设置如表1所示。参数的取值会对算法的性能造成一定的影响,参数值的选择是根据不同的实验结果得到的一组性能较好的参数。

图片

表1   算法参数设置

3.2 实验场景设定

本文设定蓝方防御设施包括6个雷达和6个发射车,其位置分别为(-5, 0)、(5, 0)、(-5, 10)、(5, 10)、(-5, 20)、(5, 20)。编号相同的雷达和发射车在同一位置,雷达1和雷达6、雷达2和雷达4、雷达3和雷达5所用频率资源相同,所有导弹均为匀速运动,对每个来袭目标最多发射5枚防空导弹,每个雷达通道上限为3,每个来袭目标占用的雷达通道数为1。

本文将防空导弹速度进行无量纲处理,设定为0.5,来袭目标依据其常见速度,进行等比例转化,选择3种典型值,设为0.2、0.1、0.05。本文设计了2种作战场景,第1种场景的来袭目标数为24,每个发射车配备30个防空导弹;第2种场景的来袭目标数为60,每个发射车配备75个防空导弹,且每个来袭目标都有不同的发射角度和发射位置。

3.3 仿真实验结果

将本文算法MOEA/D-AD与NSGA-II[25]、MOEA/D、GA算法进行对比,其中,GA算法是单目标优化算法,仅对最大毁伤效能进行优化,且这些算法的种群数和最大迭代次数都设置为200。

表2为目标毁伤效能最大的解中不同算法的雷达资源消耗,结果显示MOEA/D-AD算法在2种场景下均得到了目标毁伤效能最高的资源分配方案,并且雷达资源消耗最小。GA算法在来袭目标数为24的场景下目标毁伤效能与其他3个算法接近,但雷达消耗资源远超过其他3个算法。当来袭目标数为60时,约束变得更加复杂,GA算法难以处理这些约束,目标毁伤效能最低,且雷达资源消耗也最多,MOEAD-AD算法和MOEA/D算法的目标毁伤效能较为接近,但MOEA/D-AD算法的雷达资源消耗明显更低。NSGA-II算法和MOEA/D算法相比,NSGA-II算法能得到雷达资源消耗更小的结果,2种算法能找到目标毁伤效能较为接近。

图片

表2   最大目标毁伤效能下不同算法的雷达资源消耗

图5~6对来袭目标数分别为24和60的3种算法进行了求解,MOEA/D-AD算法在2种场景下的Pareto最优解集均支配其他2种算法的Pareto最优解集,证明了该算法的有效性。来袭目标数为24的作战场景中,MOEA/D-AD和MOEA/D算法的解在目标空间分布比NSGA-II算法更均匀,但NSGA-II算法得到的结果比MOEA/D算法略好。来袭目标为60的作战场景中,NSGA-II算法的分布性得到了提升,但仍差于其他2个算法,并且和MOEA/D算法适应度值较为接近。

图片

图5   不同算法在来袭目标数为24的适应度

图片

图6   不同算法在来袭目标数为60的适应度

MOEA/D和MOEA/D-AD算法的时间复杂度相同,每一次迭代的时间复杂度为O(NT) ,NSGAII算法的时间复杂度为O(N2) ,其中,N为种群个数,T为邻居数,取值为10,因此,MOEA/D和MOEA/D-AD的消耗时间比NSGAII更低。来袭目标为24时,MOEA/D-AD、MOEA/D和NSGAII算法运行平均时间分别为46.53、46.28、50.15 s,来袭目标为60时,3种算法运行平均时间分别为111.27、112.58、120.83 s。

图7为不同算法运行30次后的适应度盒图。在来袭目标数为24的场景下,MOEA/D-AD算法在目标函数f2 上的结果超过了其他2种算法,并且得到的目标函数值更集中,而在目标函数f1 上的结果与NSGA-II较为接近,且均优于MOEA/D算法。在来袭目标数为60的场景下,MOEA/D-AD算法有少量异常值,但整体稳定性优于其他2种算法,且适应度值f1 和f2 结果更有优势,验证了该算法的寻优性能。

图片

图7   不同算法盒图

图8分别为MOEA/D和MOEA/D-AD算法在60个来袭目标场景下的甘特图,目标排序序号越小,代表该来袭目标紧急程度越高,2种资源分配方案的目标毁伤效能近似,分别为132.3和132.6。时间超过200后,MOEA/D-AD算法分配的制导方案少于MOEA/D算法,且最晚打击方案的发射时刻分别为700和500,因此,MOEA/D-AD算法更有利于观测打击结果,以便后续第二轮打击的资源分配。MOEA/D-AD算法对所有来袭目标分配了制导方案,而MOEA/D算法对目标53未分配制导方案,且MOEA/D和MOEA/D-AD算法的雷达开机总时间分别为2 433和1 943,验证了MOEA/D-AD算法的有效性。

图片

图8   来袭目标数为60的甘特图

4 结论

本文提出一种改进的MOEA/D算法来求解防空导弹目标武器分配问题,该算法在种群进化中自适应调整每个个体交叉和变异的比率,增强算法在目标空间的搜索性能,在运行过程中同时处理多个约束,实验结果表明:相比其他多目标算法和单目标算法,该算法能得到总体目标毁伤效能最高且雷达资源消耗最小的结果,且Pareto最优解集支配于其他算法,具有一定的实战意义,能够发挥多资源协同作战的优势,达到提高作战效果的目的。未来工作中,将考虑雷达在短时刻内出现故障,多阶段资源分配等因素,使算法更贴近真实作战场景。

声明:公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨,并不意味着支持其观点或证实其内容的真实性。版权归原作者所有,如转载稿涉及版权等问题,请立即联系我们删除。

注:若出现无法显示完全的情况,可 V  搜索“人工智能技术与咨询”查看完整文章

  • 21
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值