Lyapunov, Adaptive, and Optimal Design Techniquesfor Cooperative Systems

摘要:

本文主要是提出多智能体系统在有向图上的协同控制的三种设计技术:Lyapunov设计、神经自适应设计、基于线性二次型(LQR)的最优设计。使用精心设计的Lyapunov方程使得在无向图或者平衡图上的协同控制结果可以推广到强连通图。神经自适应控制主要是为了解决动态方程未知或信号失调的协同跟踪问题。对于积分动力学方程作为特例时的协同跟踪问题,通过使用基于LQR的最优控制技术,控制增益可以从图拓扑结构中解耦。而且,同步区域无界,这是控制器需要的期望性质。

II.图论

本文考虑图是时不变的,也就是说邻接矩阵A是常数矩阵。本文只考虑简单图,不包括self-edge,也即是aii=0;对于无向图,aji=aij,即A=A转置。若定义结点i的出度:di'=aji求和,D0=diag{di'},L0=D0-A转置,一个节点若是平衡点,即出度等于入度,一个图若为平衡图则该图的所有节点都是平衡点。若矩阵A是不可约的,如果它不是下三角矩阵的共导数,也就是A不满足:

矩阵A被称为M-矩阵。

引理1:如果图G是强连通的,Laplacian 矩阵L是无约的奇异M矩阵,并且0是L的简单特征值。

引理2:如果图G是强连通的,rank(L)=n-1.

引理3:当且仅当有向图含有有向生成树时,0是L的简单特征值。

引理4:当且仅当0是L的简单特征值时,无向图是联通的。

III.协同调节器问题的Laplacian 潜力和Lyapunov稳定性分析

Laplacian潜力的带0-1邻接元素的无向图和带权重的无向图已经研究过了。本文Laplacian potential推广到有向图上。

A. Graph Laplacian Potential

定义1:

Laplacian potential定义形式如下:

引理5:

x=[x1,x2,...xn]T,

(1)对于一般有向图:

L0是列Laplacian矩阵

(2)对于无向图:

(3)对于平衡图:

对于引理5(1)的证明来看,没怎么看懂。。。引理5(1)证明完之后,(2)(3)就证明出来了。

(3)(4)式可以被用来做Lyapunov分析。(2)无法被直接用。

定义2:

假设图是强连通的,定义p=[p1,p2,...,pn]T,是L矩阵特征值λ = 0相关的左特征向量,广义图Laplacian potential定义为:

引理6:

假设图是强连通的:

VL可以改写为:

P>0,Q>=0.引理6的证明也看的比较模糊。。。

引理6提出了广义的Laplacian potential 实际上提供了一种构造Lyapunov方程的方法。

在协同调节器问题上的Lyapunov 分析,Laplcian potential 扮演了一个重要角色。

B. Lyapunov Analysis for Cooperative Regulator Problems

  1. 单个调节器的共识(Consensus of Single Integrators):

考虑N个智能体单积分动力学:

考虑一个通常的线性共识策略:

闭环系统可以总体的写成:

(写成总体形式终于会推导了!!!哈哈哈哈)

引理10:

如果无向图G是联通的,一致性可以通过一致性控制策略(7)达到。

引理10证明开始直接给出Lyapunov函数,对Lyapunov函数求导,得到其导函数小于等于0,后面就没看懂了。。。

对于有向图来说,L不是恒大于等于0,此时引理10不成立。

引理11:

如果图G是平衡弱连通图,使用(7)的控制策略能达到一致性。

引理11的证明也和引理10差不多,构造Lyapunov函数,根据拉萨尔不变性原理(LaSalle invariance principle)

若图不是平衡的,引理11就不成立。下面介绍引理12,一种一般有向图上的Lyapunov稳定性分析。

引理12:

对于强连通图,使用(7)可以达到一致。

注意到,引理10、11、12的Lyapunov函数的导数都是Lyapunov potential的负数形式。第一左特征向量值十分重要

  1. 无源非线性系统的同步(Synchronization of Passive Nonlinear Systems):

这部分讨论的是无源非线性系统同步分析的一项技术。这项技术表明,基于存储函数的Lyapunov函数可以实现有向图上无源系统的分析,该函数由Laplace矩阵第一左特征向量元素pi加权。强调了保留系统无源属性的重要性。

无源系统很重要,因为很多机械系统通过质量,弹簧,减震器系统组成。这些无源属性可以通过无源非线性系统来建模,单积分器是一种特殊的非线性系统。

前人假设图是强连通和平衡的,本文放松条件,变为一般强连通图,平衡与否不是必须的。

考虑系统N个智能体:

fi(0)=0,gi(0)=0;

fi(·), gi(·), hi(·)均为非线性方程。

引理13:

输出同步(并不意味着所有的输出yi均趋于0):

考虑一个更一般的控制律:

定理1:

假设图是强连通的,用(10)控制系统(8),智能体组输出同步。

证明此定理即证明,Lyapunov函数:

渐近稳定,即导函数恒小于等于0.

(证明过程没怎么看懂,矩阵计算,求和计算。。。)

定理1将前人的工作推广到一般强连通图上,通过图Laplace矩阵的第一左特征向量pi对节点存储函数进行加权。

IV . 协同跟踪问题的神经自适应设计(NEURAL ADAPTIVE DESIGN FOR COOPERATIVE TRACKING PROBLEM)

第III部分考虑的是所有节点收敛至非规定的相同值的共识问题,这一部分将考虑协同跟踪控制问题。这一部分的系统将是未知动态方程和信号干扰未知的非线性系统,因此,跟踪控制问题应该是robust。使用神经自适应设计技术解决跟踪控制问题,分别对一阶和高阶非线性系统做了研究。

A.Cooperative Tracking Control of First-Order

1) Problem F ormulation:

考虑N个智能体系统:

ζi ∈ R,是外部信号干扰。假设动态系统(13)是提前完成的(forward complete),也就是说,对于每个初始条件,每个有界输入和信号干扰,xi(t)在t大于等于0时成立。

考虑领导者:

系统(14)动态方程未知,考虑为提前完成的。

定义3:

定义4:(一致最终有界)

2) Controller Design:

使用神经自适应控制技术对(13)(14)系统进行控制,控制策略如下:

假设1:

引理14:

Lyapunov函数(17)在控制跟踪问题分析上扮演重要角色。

3) Main Result:

通过使用控制策略(15)和NN自适应协调律,闭环系统控制律如下:

定理2:

B. Cooperative Tracking Control of High-Order

1) Problem Formulation:

考虑系统如下:

考虑领导者:

定义5:

假设2:

2) Controller Design:

3) Main Result:

定理3:

高阶的没看懂在干什么。。。所以写的就不是很详细了。

V. 协同跟踪问题基于LQR最优设计(LQR-BASED OPTIMAL DESIGN FOR COOPERATIVE TRACKING PROBLEM)

LQR是众所周知的对称设计技术在线性系统的最优控制中。本节中展现LQR设计方法在线性系统的协同最优控制中,并且表明相关的控制策略对于图拓扑结构具有鲁棒性。

A.Problem Formulation

考虑线性系统如下:

其中A稳定不是必须的,(A,B)稳定。

考虑领导者:

主要目的是使各个智能体跟随领导者。

B.Controller Design

设计控制器:

耦合增益c、反馈控制增益矩阵K。

定义跟踪误差:

跟踪误差动态方程:

引理15:

这个引理将控制增益K和耦合增益c与图结构性质(i.e.,特征值λi)进行了混合,相当于这三个参数进行耦合,此时稳定的控制增益矩阵K对不同的图拓扑结构可能不是鲁棒性的。不具有一般性。

因此基于LQR的控制增益被提出来了,此方法具有鲁棒性。(鲁棒性在后面体现。)

C.Main Result

定理4:

此定理展示了控制增益K与耦合增益c进行了解耦,将控制增益从图拓扑的详细信息中解耦出来了,只与耦合增益c有关。

基于LQR的控制策略对图拓扑结构具有robust,具体通过“同步区域”进行展现。

定义7:

同步区域用来评估跟踪控制策略,更大的同步区域表明控制策略对图拓扑结构具有更高的robust。

推论1:

这个推论就是所提出的控制策略想要的性质。推论1表明,只要耦合增益c选择合适,在有向生成树的任意图中,我们提出的设计方法保证了结果。

英文注释:

  1. feasibility 可行性;

  1. vibration 振动;

  1. unidirectional 单向的;

  1. successive 连续的;

  1. orderless 不整齐的;

  1. irreducible 不可约的;

  1. cogredient 共导数;

  1. generalized 广义的;

  1. interpretation 解释;

  1. intuitively 凭直觉地;

  1. derivative 导数;

  1. storage 存储;

  1. preserve 保持;

  1. passivity 无源;

  1. damper 减震器;

  1. manipulator 操纵;

  1. affine 仿射;

  1. conservative 保守的;

  1. initial 有限的;

  1. piecewise 分段;

  1. continuous 连续的;

  1. exosystem 外部系统;

  1. uniform 一致;

  1. ultimate 最终;

  1. boundness 有界;

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SQLAlchemy 是一个 SQL 工具包和对象关系映射(ORM)库,用于 Python 编程语言。它提供了一个高级的 SQL 工具和对象关系映射工具,允许开发者以 Python 类和对象的形式操作数据库,而无需编写大量的 SQL 语句。SQLAlchemy 建立在 DBAPI 之上,支持多种数据库后端,如 SQLite, MySQL, PostgreSQL 等。 SQLAlchemy 的核心功能: 对象关系映射(ORM): SQLAlchemy 允许开发者使用 Python 类来表示数据库表,使用类的实例表示表中的行。 开发者可以定义类之间的关系(如一对多、多对多),SQLAlchemy 会自动处理这些关系在数据库中的映射。 通过 ORM,开发者可以像操作 Python 对象一样操作数据库,这大大简化了数据库操作的复杂性。 表达式语言: SQLAlchemy 提供了一个丰富的 SQL 表达式语言,允许开发者以 Python 表达式的方式编写复杂的 SQL 查询。 表达式语言提供了对 SQL 语句的灵活控制,同时保持了代码的可读性和可维护性。 数据库引擎和连接池: SQLAlchemy 支持多种数据库后端,并且为每种后端提供了对应的数据库引擎。 它还提供了连接池管理功能,以优化数据库连接的创建、使用和释放。 会话管理: SQLAlchemy 使用会话(Session)来管理对象的持久化状态。 会话提供了一个工作单元(unit of work)和身份映射(identity map)的概念,使得对象的状态管理和查询更加高效。 事件系统: SQLAlchemy 提供了一个事件系统,允许开发者在 ORM 的各个生命周期阶段插入自定义的钩子函数。 这使得开发者可以在对象加载、修改、删除等操作时执行额外的逻辑。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值