自动化专题讲座:导弹制导控制律综述与分析

  要:随着时代的发展,军事技术和现代技术也在迅速变化,对精确制导的需求日益增加,制导技术广泛应用于需要拦截或精确命中目标的领域。不同于传统的空中目标拦截、空间目标和近空间高超音速目标等特殊拦截要求,以及多模式导引头和直/气复合控制等新技术的应用,这些都是导弹制导控制的新问题和挑战。本文分析了当前的导弹制导作战需求和挑战,着重讨论了制导控制研究中几个热点问题的研究进展,包括一体化最优控制律(Integrated optimal control law)、滑模变结构控制(Sliding mode variable structure control)、自适应动态规划(Adaptive dynamic programming, ADP)等控制方法,并且探讨了存在的问题、可能的方向和展望。

关键词:导弹制导  滑模变结构控制  一体化最优控制律  自适应动态规划

1 背景及意义

        随着空间技术的飞速发展,各国之间的空间竞争日益激烈和扩大。精密武器的发展引起了军事大国的高度重视。导弹是军事改革中武器装备战略改造的理想目标之一。这必然推动传统作战方式的重大变革, 对现代战争观念产生巨大而深远的影响[1]。                 

        为了实现战场中对目标的精确打击, 制导律在攻击末端对脱靶量要求尤为严格,传统的导弹制导技术主要是打击固定目标或者有人驾驶飞行器等速度较慢的目标, 由于结构简单、需要的制导参数少而得到广泛应用[2]。然而, 随着科学技术的进步, 战术弹道导弹、高速智能巡航导弹、无人驾驶飞行器等的威胁越来越突出,由于此类新目标具有较快的速度和较强的机动能力, 要求导弹以最小脱靶量命中目标还不够, 还希望能够在满足某些约束条件 (例如终端角度、终端速度等) 时命中目标, 这就对制导系统的控制问题提出了新的挑战。再者, 现代和未来战争的战场环境越来越复杂, 机动目标有可能会使用各种干扰手段(例如伪装、隐蔽、欺骗等)试图躲避打击[3], 从而达到突防的目的, 这就对导弹制导系统的稳定性与鲁棒性提出了更高的要求。

2 研究现状分析

        近年来, 基于现代控制理论和智能控制理论发展的一体化最优控制律(Integrated optimal control law)、滑模变结构控制(Sliding mode variable structure control)、自适应动态规划(Adaptive dynamic programming, ADP)等诸多控制方法开始用于导弹制导律的设计。本文对目前主流的导弹制导控制方法进行了阐述和分析,探讨其应用现状和前景。

2.1 一体化最优控制律

        随着科技的发展与战争需要,导弹所打击的目标呈现多样化、高机动的特点,传统的导弹制导控制方法所依赖的频谱分离条件难以成立,造成较大脱靶量。因此,有学者提出一体化设计思路,旨在将制导与控制作为整体考虑[4],从导弹的弹体运动信息和弹-目相对运动信息直接获得舵偏指令[5],从而控制导弹飞行。总的来说,目前国内外学者在导弹制导控制一体化研究领域取得了良好的研究成果,并且因为最优控制理论控制思想简洁,方法简单,在一体化领域应用广泛。同时,现代军事的发展使得制导武器在命中目标时增加了伤害效果,不仅需要少量的失射目标,而且对导弹着陆角提出了一定的要求。目前在一体化基础上加入落角约束的研究还相对较少,探索具有落角约束的导弹制导控制一体化设计有广阔的前景。

        首先通过若干假设建立一个俯仰平面的导弹一体化简化线性模型; 然后针对简化模型,采用线性二次型最优反馈控制方法对其进行控制律设计,在控制律的最终表达式中加入重力补偿项加以弥补建模中忽略的重力; 同时,对于空地导弹,在控制律中加入目标值设定,以达到对导弹落角的限制;最后与一种带落角约束的滑模控制方法做仿真对比分析。结果表明,该设计思路所设计的一体化控制律弹道轨迹相对滑模方法更短且更为平滑,在不影响制导精度的情况下,仿真时长有所减少,证明了该控制律设计的有效性。

2.2 滑模变结构控制

        由于滑动模式对微扰的不变性对控制系统的设计非常有利,因此变结构理论在近30年来得到了迅速的发展。对线性系统,滑动模态的运动品质,除了通过选择切换函数使它渐进稳定外,还可使其极点任意配置,或使二次型指标最优。但变结构控制理论更重要的特色是,滑模控制器逐渐被用来解决参数不确定或模型非线性控制系统,成为控制系统的一般综合方法,并且推广到各种类型的控制对象和控制目的中去。如:模型跟踪系统、自适应控制、大系统、分布参数系统、时滞系统、离散系统、随机系统、学习控制、神经网络、模糊系统、极大极小控制。[6]首先将变结构控制系统理论用于模型跟踪控制系统,控制目标是参考模型,设计确定控制输入,以使模型和对象之间的误差渐近趋于零。有学者对此方法提出了改进,消除了参考模型的阶必须等于对象的阶这一约束。针对不可测状态系统,开发了变结构观察者和输出反馈系统的变结构控制。前苏联深入研究了可变结构控制理论。

2.3自适应动态规划

        自适应动态规划技术是最优控制领域新近兴起的一种近似最优控制方法, 是当前国际最优化领域的研究热点[7], 其本质是基于强化学习(Reinforcementlearning, RL)原理, 模拟人类通过环境进行反馈学习, 是一种非常接近人脑智能的控制方法.。ADP技术的基本结构是执行器-评估器结构。执行器模块通过与环境的交互产生决策或控制。评估员模块通过评估系统的性能来调整控制策略。ADP 理论融合了强化学习、动态规划以及函数近似等方法, 利用函数近似结构估计代价函数, 采用离线或在线更新方法, 逼近系统的最优解, 从而有效地解决非线性系统的最优控制问题。从学科的角度来看, ADP 依托现代控制理论和计算智能理论, 是一种新的智能控制理论与方法[8]。

        作为一种近似最优控制方法, ADP技术在导弹制导律设计中可以发挥不可限量的作用。下面简单介绍 ADP技术在导弹制导律设计中可能发挥的作用以及发展趋势:

        1):多重约束下的ADP指导。随着战场环境的日益复杂, 为了有效提高导弹的战斗能力, 在研究制导控制问题时应该考虑一些约束条件。 从控制的角度来说, 约束主要分为两类: 一是控制约束, 即对输入的约束。 例如过载的饱和特性、姿态控制中气动舵的饱和特性等; 二是状态约束,即在一定时间或整个制导过程中对某些状态变量的约束。例如终端角度约束、终端速度约束、弹着时间约束等。约束条件下的制导控制问题实质上是状态变量或控制输入受多种不同形式约束的一类非线性系统的控制问题, 而非线性最优控制是解决约束控制问题的有力工具。ADP制导不仅能够解决非线性最优制导求解困难的问题, 而且能够有效地处理多种约束条件下的制导问题。

        2):输入不理想条件下的ADP 制导。在实际制导控制过程中, 经常会出现执行机构卡死、损坏等故障, 而不能提供理想控制输入的情况。目前, 处理执行器故障问题主要采用容错控制方法, 而有关ADP容错控制的理论研究成果目前很少。因此,基于容错控制的ADP引导研究不仅可以丰富ADP理论的应用范围,而且对不理想的输入条件下的ADP引导具有重要的意义。

        3):有限时间ADP制导。由于在实际制导过程中, 通常需要导弹能够在有限时间内击中目标, 从而保证打击效果。而目前ADP绝大部分理论都是基于无限时间最优控制。有限时间ADP控制问题的理论研究仍然是一个难点。

        4):ADP协同制导。随着战场环境的复杂以及未来战争的需要, 发展多导弹协同制导系统已经势不可挡。目前最优控制和微分对策在多弹协同制导过程中被广泛应用, 但就目前的研究现状而言, 大多以末制导初始时刻的视线为基准进行线性化, 在惯性直角坐标系下采用线性模型研究协同制导问题。ADP方法能够有效解决复杂非线性系统的最优控制问题, 考虑更贴合实际的非线性模型时,研究基于ADP技术的多导弹协同制导问题将是一个十分有用的探索。

3 总结与分析

        根据以上分析,对当前主流的导弹制导控制方法进行以下总结:

        1):具有落角约束的导弹制导控制一体化设计相对滑模方法更短且更为平滑,在不影响制导精度的情况下,仿真时长有所减少,证明了该控制律设计的有效性。

        2):滑动模态对摄动的不变性十分有益于控制系统设计,变结构控制设计比较简单,便于理解和应用,所以广泛应用于许多工程实际系统。

        3):自适应动态规划技术本质上属于最优控制领域,因此研究基于自适应动态规划技术的导弹制导律不仅能够有效处理非线性最优制导律求解困难等问题,而且为实现导弹的智能化、精确化、灵巧化提供了坚实的理论基础,具有较高的应用价值。

        随着现代战争中, 攻击作战导引的条件越来越复杂, 目标机动性与回避手段的提高, 对导引控制策略的实时性规划计算, 及智能化实现提出了更高的要求,导弹制导控制律研究, 将向着贴近应用, 实现智能控制的方向发展,因此, 导弹制导控制研究的发展趋势是, 运用包括智能控制在内的现代控制理论和技术, 探讨可靠性好、智能化程度高的实时动态优化算法, 设计满足实际运用需要的导弹制导控制律[9]

4 参考文献    

[1]    刁兆师. 导弹精确高效末制导与控制若干关键技术研究 [D]; 北京理工大学, 2015.

[2]    李运迁. 大气层内拦截弹制导控制及一体化研究 [D]; 哈尔滨工业大学, 2011.

[3]    孙传鹏. 基于博弈论的拦截制导问题研究 [D]; 哈尔滨工业大学, 2014.

[4]    覃天, 陈万春, 邢晓岚. 一种带落角约束的精确导引方法(英文) [J]. 宇航学报, 2012, 33(05): 570-6.

[5]    尹高扬, 周绍磊, 薛于廷. 带落角约束的非奇异变结构导引律设计 [J]. 弹箭与制导学报, 2011, 31(06): 62-5.

[6]    米文鹏, 郭刚, 洪成华, et al. 离散模糊变结构控制在飞行器姿态控制系统中的计算机仿真研究 [J]. 计算机与网络, 2010, 36(12): 73-6.

[7]    QINGLAI W, DERONG L. A novel policy iteration based deterministic Q-learning for discrete-time nonlinear systems [J]. Science China(Information Sciences), 2015, 58(12): 147-61.

[8]    姚郁, 郑天宇, 贺风华, et al. 飞行器末制导中的几个热点问题与挑战 [J]. 航空学报, 2015, 36(08): 2696-716.

[9]    潘云芝, 潘传勇. 导引律研究现状及其发展 [J]. 科技信息, 2009, 13): 432-3.

  • 1
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

destiny579

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值