无人驾驶车辆模型预测控制_模型预测控制——绪论(1)

本文介绍了模型预测控制(MPC)的基本原理,包括确定性和随机模型、状态估计、动态规划以及约束处理。核心是利用动态模型预测系统行为并进行优化控制。文章详细阐述了线性动态模型、输入-输出模型、分布式模型和离散时间模型,并讨论了输入和状态约束的处理方法,包括软约束和硬约束的概念。
摘要由CSDN通过智能技术生成

cf0e638d8af8a05bc39c992af5f48df4.png

前言:模型预测控制这一系列的文章是根据“Model Predictive Control: Theory, Computation, and Design”这本书来写的,展现的是这本书的主要内容以及模型预测控制的基本方法。自己学习的同时也与大家一起分享。详细资料参考网址:

www.chemengr.ucsb.edu/~jbraw/mpc​www.chemengr.ucsb.edu

这里开始介绍这本书的第一章内容,这一篇主要讲绪论的introduction以及建模部分,主要的目录如下图所示,由于篇幅原因,剩下的内容将继续分几次写完。这里开始介绍这本书的第一章内容,这一篇主要讲绪论的introduction以及建模部分,主要的目录如下图所示,由于篇幅原因,剩下的内容将继续分几次写完。

7d56f6d3bfae83e02e989db3bb933148.png

1.1. Introduction

本章的主要目的是为模型预测控制(MPC)的基本要素提供一个简洁的、可理解的概述。我们介绍了确定性和随机模型、调节、状态估计、动态规划(DP)、跟踪、扰动以及一些重要的性能特性,比如闭环稳定性、对扰动的零偏移。

1.2. Models and Modeling

模型预测控制源于最优控制。MPC的基本概念是利用动态模型对系统行为进行预测,并对预测进行优化来产生当前控制运动的最佳决策。因此,模型是MPC的核心。由于最优控制动作取决于动态系统的初始状态,MPC的第二个基本概念是利用过去的测量记录来确定系统最可能的初始状态。状态估计问题是检查过去数据的记录,并将这些测量结果与模型进行协调,以确定当前状态的最可能值。调节问题和估计问题都涉及动态模型和优化。调节问题是用模型预测来产生最优控制动作,而估计问题是用测量的过去记录来产生最优状态估计。

我们首先讨论本文中使用的动态模型。我们从熟悉的微分方程模型开始:

其中
是状态,
是输入,
是输出,
表示时间,

表示n个实向量的集合。一般的,我们定义初始时间为零,并有相应的初始条件

1.2.1 Linear Dynamic Models

Time-varying model:最一般的线性状态空间模型

其中,
是状态转移矩阵,
是输入矩阵,
为输出矩阵,
允许u和y之间直接耦合,在许多应用中取D=0。

Time-invariant model:当A,B,C,D都是时不变的,线性模型可以写成

使用线性模型来近似物理系统的主要原因之一是线性模型的容易解决和分析。上式可以通过求解得到:
1.2.2 Input-Output Models

如果我们对系统的内部结构知之甚少,可以采取另一种方便的方法,即抑制状态变量,只关注可操作的输入和可测量的输出。

7619e4d16172c7c43b560cb5d683afe0.png
图1 输入-输出系统图

如图1所示,我们考虑一个系统由u与y组成,我们通常进行系统识别实验,在实验中我们操纵u和测量y,并为G建立简单的线性模型。

为了利用简单级数和反馈连接的常用框图操作,考虑信号的拉普拉斯变换而不是时间函数是很方便的。其中
是复值拉普拉斯变换变量,然后从数据中识别出传递函数矩阵,该框图表示如下输入与输出之间的数学关系:

其中

是转移函数矩阵,状态并没有出现在这个输入-输出描述中。

1.2.3 Distributed Models

当我们考虑非空间均匀的系统时,就会出现分布式模型,这里不细讲。

1.2.4 Discrete Time Models

如果所关心的系统在离散时间采样,离散时间模型通常是更方便的。如果选择适当的采样率,样本之间的行为可以被安全地忽略,并且模型只描述样本时刻的行为。该有限线性定常离散时间模型如下所示:

一般的,为了减少符号的复杂,我们写成如下形式:

上标+表示下一采样时刻的状态,线性离散时间模型便于在尽可能简单的数学设置中表达MPC的思想和概念。因为模型是线性的,解析解很容易推导出来。通过定义信号的z变换,得到了连续时间输入输出模型的离散时间模型:

离散传递函数矩阵G(z)表示离散输入-输出模型:

1.2.5 Constraints

对大多数物理系统的操纵输入(比如阀门位置、电压、力矩等)是有限制的,我们把这些约束包括在线性不等式中:

其中
是用来简单描述边界的,例如
。我们有时希望为安全、可操作性、产品质量等方面的考虑对状态或输出加以限制,这些可以表述为
。一些实践者发现,在某些应用中限制输入的变化率更加方便,为了获得模型的状态空间形式,我们将状态增强为
因此增强的系统模型变为
这里的
的具体形式为
变化率约束
,则可以写成

为了简化分析,在建立线性动态模型时,需要保持线性约束。如果我们想考虑一个线性系统的一般约束条件,我们选择它的形式

而当考虑非线性系统时,保持线性不等式并不能显著地简化控制器的分析,而推广了约束集:

这里需要注意,输入约束和输出或状态约束之间的一般区别。输入约束通常代表物理限制,如果控制器不遵守输入约束,物理系统就会强制执行它们。而输出或状态约束通常是可取的,它们可能无法实现,这取决于影响系统的干扰。MPC控制器的功能通常是实时确定输出或状态约束无法实现,并以某种令人满意的方式放松它们。下面也会讨论这些问题,MPC经常使用硬约束作为输入约束,使用某种形式的软约束作为输出约束或状态约束来建立优化问题。

Soft state or output constraints

先考虑一组硬输入及状态约束:

为了软化状态约束引入松弛变量

,通过如下方法松弛状态约束并且引入新约束
。考虑增强输入为
,软状态约束可以这么表达
。其中

随后人们制定了一个阶段代价惩罚来衡量人们对状态x、输入u以及对硬状态约束的违反的关注程度,这个约束是由给定的。硬状态约束被混合状态输入约束所取代。这样做的好处是,状态约束在控制问题中不会造成不可行,因为可以通过选择对状态约束进行放松;用阶段成本函数来衡量,较大的ε值可能是不可取的,但也不是不可行的。

Discrete actuators and integrality constraints

在许多工业应用中,执行器或决策变量的子集可能是整数值或离散的。一种常见的情况是,当过程中有一组类似的装置同时运行(如熔炉、加热器、冷却器、压缩机等),在这类过程中控制问题的一部分是决定在过程运行期间这些离散单元中的多少和哪些应该开或关,以满足设定值或抑制干扰。离散决策也出现在许多调度问题中,这里不再赘述。定义离散值执行器可以添加约束

1.2.6 Deterministic and Stochastic

如果检查来自任何复杂物理过程的测量,图2所示的数据波动总是存在。对于小尺度的应用,波动可能是由小分子数量的随机行为引起的。随着科学家和工程师研究纳米技术的应用,这种应用越来越普遍。当模拟一些病毒粒子或蛋白质分子与活细胞的相互作用时,这种类型的系统也出现在生命科学的应用中。在这些应用中没有确定性的模拟模型,唯一可用的系统模型是随机的。

fff95bff7c8388414e371968a85bf61c.png
图2 随机系统随时间的输出图

Linear time-invariant models

在主流的经典过程控制问题中,我们通常关注的是宏观系统的建模、监控和控制。我们没有考虑由少量分子组成的系统。因此,人们自然会问,在这个领域中随机模型的动机是什么?随机模型的动机是为了解释未建模的环境(干扰)对被研究系统的影响。如果我们从任何感兴趣的过程控制系统检查测量,无论多么宏观,我们面临的物理现实是,测量仍然很像图2,如果对观测到的测量波动建模是重要的,我们转向随机模型。

数据中观测到的一些波动可分配给测量装置。这种波动源称为测量噪声。某些观测到的数据波动可归因于影响系统状态的环境的未建模干扰,表示这两种可能的扰动源的最简单的随机模型是带有附加随机变量的线性模型:

变量v用来描述测量噪声,w描述过程扰动。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值