Differential games:pursue,formation control problem

微分博弈理论结合最优控制与博弈论,用于研究动态系统中多参与者对抗或合作的问题。它在军事追逃、多无人机编队控制等领域有广泛应用。纳什均衡是微分博弈的关键概念,指所有参与者都无法单独改善其策略的平衡状态。线性二次型微分博弈是可求解的子领域,尤其适用于多无人水面艇编队控制问题。求解微分对策的方法包括离散序列法、动态规划等,但大多数问题依赖数值解。时间一致性是衡量均衡解动态稳定性的指标。
摘要由CSDN通过智能技术生成

定义:微分博弈是指在时间连续的系统,多个参与者进行持续的博弈,力图最优化各自独立、冲突目标,最终获得各参与者随时间演变的策略并达到纳什均衡,即任何参与者都没有单独改变策略的意愿。

在博弈论中,微分对策是一组与动态系统中冲突的建模和分析相关的问题。更具体地说,一个或多个状态变量根据微分方程随时间演化。

微分对策理论是在考虑一定的环境下参与对抗或者竞争活动的对手之间关系问题时,通过借助数学上的微分方程或方程组等工具以数据化的方式描述整个关系问题的现象和内在规律的一种以时间为主轴的动态对策。

对解微分对策问题进行求解就是对一个复杂的最优化的控制理论问题的求解

在博弈问题中,每一个博弈个体都有一个代价函数,这个代价函数不但和自己的行为决策有关,
还和其他所有的博弈个体的行为决策有关。

每个博弈个体通过改变自己的决策来最小化自己的代价函数,博弈个体在最小化自己代价函数
的时候,势必会造成其他个体的损失及使其他个体的代价函数变大。其目的在于求解纳什平衡点。

当博弈个体处于纳什平衡点的时候,任意一方个体都不能单独改变自己的决策来减小自己的代价函数,也就是说每个博弈个体都处于最差情况下的最优状态。

在二十世纪四十年代,两种新兴的数学工具——最优控制理论和博弃论得到了迅速发展,前者用于在动态系统中最优化控制目标,后者用于在多人互动的系统中进行多主体多目标决策。而事实上,现实生活中有许多问题是在动态系统中进行多主体多目标决策,这就要求两种理论发生交互与融合。Isaacs 是最早提出这个想法的学者,他在年供职于美国著名的公司时,提出综合最优控制和博弃论以解决美国军方交给公司的军事追逃问题。他在此期间发表的论文提出了解决追逃型二人零和动态博弈的基本方法】,后来他又拓展了这些工作并总结为《Differential games》一书由此奠定了微分博弈理论的研究基础。

最优控制是指对于一个受控系统做出最优的控制策略,它关键被用到动态的系统或者多目标的控制决策选择中。而博弈论的用途也是在于多成员多策略的选择收益最大。所以在现实生活中,当面对群体性的选择控制,将最优控制与博弈论结合起来不失为一种绝妙的组合方案。Isaacs在1948年-1950年为了解决军方交给的军事追逃问题,就第一次定义了微分博弈这个概念。他提出综合最优控制与博弈论相结合的思想,并且与此同时发表论文阐述了解决追逃型二人零和动态博弈的基本方法,以后在此方面做了更加深入的研究,并将所有相关的工作总结成书。从此开始,微分博弈的发展才算正式有了坚实的理论支撑。
 

微分博弈属于动态博弈,在多方发生动态冲突、竞争或者多方进行合作时,它是一个很有效的工具。概括来说,微分博弈就是在研究对象或规律的基础上,利用微分方程(组)来描述局中人进行的博弈活动。它是一种多方最优控制问题,并将现代控制理论与博弈论相互结合,从而具有更强的竞争性与对抗性。可以研究控制科学中一些自身的问题,例如不确定动态系统的控制等,因此微分博弈具有很高的理论研究价值,也有非常广阔的应用前景。

微分博弈的难点在于:前一时刻解析的最优策略在下一时刻可能不再是最优解,因此在求解上遇到很大的阻碍。
————————————————————————————————

1. 线性二次型微分博弈:
微分博弈理论分支非常多,而结合最优控制,采取其中的线性二次型微分博弈理论,对多无人水面艇编队方程进行求解。线性二次型微分博弈要求博弈中所有成员的目标函数均可被描述为线性二次函数。按照博弈控制时间长度是否有上限,线性二次型微分博弈又可以分为有限时域线性二次微分博弈和无限时域线性二次微分博弈,关于线性二次型微分博弈的问题主要集中在对非合作均衡的研究。
线性二次型微分博弈易于求解,这也

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值