随机模型,估计与控制 ——介绍

1.1 为什么要学习随机模型、估计与控制理论

在考虑系统分析或控制器设计时,工程师可以运用确定性系统和控制理论的丰富知识。人们自然会问,为什么我们必须超越这些结果,提出随机系统模型,并基于这些随机模型提出估计和控制概念?为了回答这个问题,让我们检查确定性理论提供了什么,并确定缺点可能在哪里。

对于一个物理系统,不管它是飞机、化学过程还是国民经济,工程师首先尝试开发一个数学模型,充分代表该系统行为的某些方面。通过物理洞察、基本的“规律”和经验测试,他试图建立某些感兴趣的变量之间的相互关系、系统的输入和系统的输出。

有了这样一个数学模型以及系统和控制理论提供的工具,他就能够研究系统结构和响应模式。如果需要,他可以设计能够改变这些特性的补偿装置,以及提供适当输入以生成所需系统响应的控制器。

为了观察实际的系统行为,测量装置被构造成输出与某些感兴趣的变量成比例的数据信号。这些输出信号和系统的已知输入是关于系统行为的唯一可直接识别的信息。此外,如果正在设计反馈控制器,则测量装置输出是直接可用于控制器输入的唯一信号。

决定论系统和控制理论没有提供一个完整的分析和设计方法有三个基本原因。首先,没有一个数学系统模型是完美的。任何此类模型仅描述与工程师目的直接相关的特征。例如,尽管精确描述车辆弯曲需要无限多的弯曲模式,但在一个有用的模型中只包含有限数量的模式。该模型的目标是表示系统响应的主要或关键模式,因此许多影响被有意地保持不变。事实上,用于生成在线数据处理器或控制器的模型必须简化为基本要素,才能生成计算上可行的算法。

即使是模拟的效果也必须用数学模型来近似。牛顿物理学的“定律”是对实际观测结果的充分近似,部分原因是我们不习惯接近光速。通常情况下,此类“法律”提供足够的系统结构,但该结构中的各种参数并非绝对确定。因此,在一个系统的任何数学模型中都有许多不确定性的来源。

确定性模型的第二个缺点是,动态系统不仅由我们自己的控制输入驱动,而且由我们既不能控制也不能确定地建模的扰动驱动。如果飞行员试图控制飞机的某个角度方向,由于风的冲击、控制面执行器响应的不精确,甚至他无法通过自己的手臂和手在控制杆上产生准确的期望响应,实际响应将不同于他的预期。

最后一个缺点是,传感器不能提供关于系统的完美和完整的数据。首先,它们通常不提供我们想要知道的所有信息:要么一个设备不能被设计成产生一个期望变量的测量,要么包括这种测量的成本(体积、重量、货币等)是禁止的。在其他情况下,许多不同的设备产生功能相关的信号,然后必须询问如何基于部分冗余数据生成感兴趣变量的最佳估计。传感器不提供所需数量的精确读数,但也引入了自己的系统动力学和畸变。此外,这些设备也总是被噪声破坏。

从前面的讨论可以看出,假设完全了解描述一个系统所需的所有数量和/或假设对系统的完全控制是一种幼稚的、通常是不充分的方法。这促使我们提出以下四个问题:

(1)您如何开发系统模型,以直接、适当、实用的方式解释这些不确定性?

(2)配备了这样的分析模型和来自不完整的且易受噪声破坏的可用传感器的数据之后,您如何最佳地估计您感兴趣的信息?

(3)面对不确定的系统模型,面对不完整且易受噪声破坏的数据,以及超出我们所能控制范围的干扰,您如何以理想的方式优化控制系统?

(4)在这些估计和控制系统被构造前后,您如何评价系统性能?

我们后面将以一种有意义和有用的方式回答这些问题。

1.2 概述

1.3 Kalman滤波简介

在我们深入研究文本的细节之前,在概念基础上看看我们要去哪里是很有用的。因此,这一章的其余部分将提供一个最佳线性估计的概述,卡尔曼滤波器。这将在非常基础的层面上进行,但将提供对基本概念的洞察。当我们在这个概述中前进的时候,思考一下正在呈现的想法:尝试构思图形图像来描绘所涉及的概念(例如密度函数的时间传播),并为组合在一起解决估计问题的组件生成一个逻辑结构。如果这个基本的概念框架对您有意义,那么您将更好地理解稍后在本文中开发细节的需求。如果细节的发展使我们将要去哪里的想法变得模糊不清,请参阅本概述以重新看到总体目标。

首先要问的是,什么是卡尔曼滤波器?卡尔曼滤波是一种简单的最优递推数据处理算法。根据选择的评估性能的标准,有许多定义最优的方法。结果表明,在下一节所做的假设下,卡尔曼滤波器对于任何有意义的标准都是最优的。这种最优性的一个方面是卡尔曼滤波器合并了所有可以提供给它的信息。它处理所有可用的测量值,无论其精度如何,以估计感兴趣变量的当前值,这些被使用的值包括(1)系统和测量装置动力学知识,(2)系统噪声、测量误差和动力学模型不确定性的统计描述,(3)有关相关变量初始条件的任何可用信息。例如,要确定飞机的速度,可以使用多普勒雷达,或惯性导航系统的速度指示,或空气数据系统中的空速管和静压以及相关风信息。与其忽略这些输出,还不如建立一个卡尔曼滤波器,将所有这些数据和各种系统动力学知识结合起来,生成一个整体的最佳速度估计。

前一个描述中的“递归”一词意味着,与某些数据处理概念不同,卡尔曼滤波器不需要每次进行新的测量时都将所有以前的数据保存在存储器中并重新处理,这对于滤波器实现的实用性至关重要。

“过滤器”实际上是一种数据处理算法。尽管滤波器的典型内涵是包含电网的“黑匣子”,但事实上,在大多数实际应用中,“滤波器”只是中央处理器中的一个计算机程序。因此,它固有地结合了离散时间测量样本,而不是连续时间输入。

图1.1描述了一种典型情况,在这种情况下,卡尔曼滤波器可以被有利地使用。某种类型的系统由一些已知的控制装置驱动,测量装置提供某些相关量的值。对这些系统输入和输出的了解是物理系统为估计目的而明确提供的所有信息。

现在对过滤器的需求变得明显了。通常,感兴趣的变量(一些描述系统“状态”的有限数量)不能直接测量,必须生成从可用数据推断这些值的方法。例如,空气数据系统直接提供静态和空速管压力,从中必须推断速度。这一推论因以下事实而变得复杂:系统通常由输入驱动,而不是由我们自己的已知控制;各种“状态”变量和测量输出之间的关系仅在一定程度上具有不确定性。此外,任何测量都会在一定程度上受到噪声、偏差和设备不准确的破坏,因此必须提供从噪声信号中提取有价值信息的方法。也可能有许多不同的测量装置,每一个都有其特定的动力学和误差特性,它们提供关于特定变量的一些信息,希望以系统和最佳的方式组合它们的输出。卡尔曼滤波器结合了所有可用的测量数据,加上系统和测量装置的先验知识,以使误差在统计上最小化的方式产生所需变量的估计值。换句话说,如果我们在同一个应用程序中多次运行多个候选滤波器,那么卡尔曼滤波器的平均结果将比任何其他滤波器的平均结果更好。

从概念上讲,任何类型的过滤器都试图从噪声环境提供的数据中获得所需数量的“最佳”估计,“最佳”意味着它在某些方面可以将错误最小化。实现这一目标有许多方法。如果我们采用贝叶斯观点,我们希望基于来自测量设备的实际数据,滤波器能够生成所期望的估计值的条件概率密度函数。为了理解这个概念,考虑图1.2,是在时间瞬间i(x(i))的标量x值的条件概率密度的描述,条件是向量测量\textbf{z}(1)在时间瞬间1的值为\textbf{z}_{1}(\textbf{z}(1)=\textbf{z}_{1}),同样在时间2到i的情况下,绘制成可能x(i)值的函数。这表示为概率密度函数f_{x(i)|\textbf{z}(1),\textbf{z}(1),...,\textbf{z}(1)}(x|\textbf{z}_{1},\textbf{z}_{2},...,\textbf{z}_{i}).

比如,令x(i)是某辆车在i时刻的一维位置,并且令\textbf{z}(j)是二维向量,代表由两个独立的雷达在j时刻检测到的位置。这种条件概率密度包含关于x(i)的所有可用信息:它表明,对于通过时间瞬间i进行的所有测量的给定值,任何特定值或值范围的x(i)的概率是多少。

它被称为“条件”概率密度,因为它在x轴上的形状和位置取决于测量值。它的形状传达了你对x值的了解程度。如果密度图是一个狭窄的峰值,那么大部分概率“权重”集中在x值的狭窄范围内。另一方面,如果图的形状是渐变的,则概率“权重”分布在更宽的x范围内,这表示您对其值的把握较低。

一旦生成了这样的条件概率密度函数,就可以定义“最优”估计。 可能的选择包括:

(1)平均值 - “概率质量中心”估计;
(2)峰值 - 具有最高概率的x的值,定位密度的峰值; 
(3)中值 -  x的值使得概率权重的一半位于其左侧和右侧的一半。

卡尔曼滤波器对于可以通过线性模型描述系统并且系统和测量噪声是白色和高斯(稍后将解释)的问题执行该条件概率密度传播。 在这些条件下,“最优”估计的均值,模式,中值和几乎任何合理的选择都是一致的,因此事实上对x的值有唯一的“最佳”估计。 在这三个限制下,卡尔曼滤波器可以被证明是任何可能形式的最佳滤波器。 可以放松一些限制,产生合格的最佳过滤器。 例如,如果去除高斯假设,则可以将卡尔曼滤波器显示为线性无偏滤波器类中的最佳(最小误差方差)滤波器。 但是,对于许多潜在的应用,这三个假设是合理的,如下一节所示。

1.4 基本假设

在这一点上,查看卡尔曼滤波器公式中的三个基本假设是有用的。 在第一次接触时,它们可能看起来过于严格且不切实际。 为了减轻这种疑虑,本节将简要讨论这些假设的实际含义。

出于多种原因,线性系统模型是合理的。 通常这样的模型对于手头的目的是足够的,并且当存在非线性时,典型的工程方法是关于某个标称点或轨迹线性化,实现扰动模型或误差模型。 线性系统是理想的,因为它们更容易用工程工具操纵,线性系统(或微分方程)理论比非线性系统更加完整和实用。 事实上,有一种方法可以将卡尔曼滤波器概念扩展到某些非线性应用或直接开发非线性滤波器,但只有当线性模型证明不合适时才考虑这些。

“白”意味着噪声值在时间上不相关。更简单地说,如果你知道现在噪音值是什么,那么这种知识对于预测其在任何其他时间的值是没有任何用处的。“白”还暗示噪声在所有频率下具有相等的功率。由于这导致具有无限功率的噪声,因此显然这样的白噪声在现实中是不存在的。然后人们可能会问,为什么还要引入这么一个在现实生活中不存在的概念呢?这又两方面的考虑。首先,任何感兴趣的物理系统都有一定的频率“带宽” - 它是可以响应的输入频率范围。超出此范围,输入要么没有效果,要么系统衰减严重。在图1.3中,典型的系统带通曲线绘制在“功率谱密度”(解释为特定频率下的功率含量)与频率的关系图上。通常,系统将由宽带噪声驱动 - 一个具有高于系统带通的频率的功率,并且在系统带通内的所有频率处具有基本恒定的功率 - 如图所示。在同一个图中,白噪声只会将这个恒定功率电平扩展到所有频率。现在,在感兴趣系统的带通内,虚拟白噪声看起来与真实的宽带噪声相同。那么取得了什么?这是为什么使用白噪声模型的答案的第二部分。事实证明,过滤器中涉及的数学被大大简化(实际上,易于处理),用白噪声代替真实的宽带噪声,从系统的“观点来看”是相同的。因此,使用白噪声模型。

有人可能会争辩说,在某些情况下,噪声功率幅度在系统带通内的所有频率上都不是恒定的,或者噪声实际上是时间相关的。 对于这种情况,通过小型线性系统发出的白噪声几乎可以复制任何形式的时间相关噪声。 然后将这个称为“整形滤波器”的小系统添加到原始系统中,以再次实现由白噪声驱动的整体线性系统。

”白“与噪声的时间或频率关系有关,而高斯度与其幅度有关。 因此,在任何单个时间点,高斯噪声幅度的概率密度呈现正常钟形曲线的形状。 通过系统或测量噪声通常由许多小源引起的事实,这种假设在物理上是合理的。 可以在数学上示出,当将多个独立随机变量加在一起时,可以通过高斯概率密度非常接近地描述求和效果,而不管各个密度的形状如何。

使用高斯密度也有实际的理由。 与“白”相似,它使数学易于处理。 但更重要的是,通常工程师最多只能知道噪声过程的一阶和二阶统计量(均值和方差或标准偏差)。 在没有任何高阶统计量的情况下,没有比高斯密度更好的假设形式。 一阶和二阶统计完全确定高斯密度,不像大多数密度函数需要无数个统计量来完全指定它们的形状。 因此,生成一阶和二阶统计量的卡尔曼滤波器包括条件概率密度中包含的所有信息,而不是仅包括其中的一些信息,如密度的不同形式的情况。

所做出的特定假设取决于正在开发的模型的目标和潜在动机。如果我们的目标只是建立良好的描述模型,我们不会将注意力限制在由白高斯噪声驱动的线性系统模型上。相反,我们会寻求最适合“现实世界”所产生数据的任何形式的模型。我们希望根据我们的系统模型构建估算器和控制器,从而推动我们做出这些假设:其他假设通常都是不产生易处理的估计或控制问题的表述。幸运的是,产生易处理数学的模型类也为许多感兴趣的应用提供了充分的表示。之后,模型结构将稍微扩展以扩大适用范围,但在随后的估计器或控制器设计中对模型有用性的要求将再次成为对扩展的制作方式的主要影响。

1.5 简单例子

要了解卡尔曼滤波器的工作原理,现在将给出一个简单的例子。 实际上,任何提供单个变量数据的单个测量设备都可以拿来做为例子。我们选择确定位置作为例子,这是因为确定某人某物的确切位置是比较常见的问题,并且与动力学理论较容易结合。

假设您在夜间迷失在海上,并且根本不知道您所在的位置。所以你需要一个星系来建立你的位置(为了简单起见,考虑一个一维的位置)。在某个时刻t_{1}你认为你在位置z_{1}。但是,由于固有的测量设备不准确,人为错误等,您的测量结果有些不确定。假设您确定标准偏差(one-sigma值)为\sigma _{z_{1}}。那么你可以建立如图1.4所示的基于观测值为z_{1}条件下的t_{1}时刻的位置x(t_{1})的条件概率。

(未完待续)

  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值