自抗扰控制中的扩张状态观测器收敛性分析1

控制类笔记总结 专栏收录该内容
11 篇文章 0 订阅

扩张状态观测器(extended state observer, ESO)是自抗扰控制(active disturbance rejection control, ADRC)的核心组成部分,在自抗扰控制的相关文献中大都会反复出现ESO和ADRC这两个英文缩写词。关于ADRC的具体思想和设计方法可以参见其发明者韩京清的专著[1],不过,专著[1]中更多地从工程角度对ADRC进行分析,而本文则主要是分析ESO论文证明的套路,也作为自己学习ADRC的一个总结,涉及到的文献则主要为[2]和[3]。

ESO的主要思想在于将包括干扰在内的系统中所有不确定的部分统一视为系统的一个新状态,即对原系统扩张了一个状态,然后设计观测器去估计这个状态。一旦实现对这个新状态的估计,那么在后面的控制律中直接将这个估计值减去,就认为达到了消除不确定性的目的,然后就可以采用任何能够保证剩下已知部分模型稳定的控制律来保证控制性能。从这个角度说,ESO其实承担了ADRC的绝大部分压力,ADRC有效的前提是ESO能够实现对扩张状态快速有效的估计。需要指出的是,ESO在设计过程中也借鉴了现有观测器的经验,而且与HK Khalil的专著[4]中提到的高增益观测器有类似之处,本质上均属于奇异摄动,即需要观测器的状态足够快。特别地,在线性情形下,ESO与文献[5]中的扩张高增益观测器具有相同形式,可见奇妙的思想总是相通的。

下面以文献[2]为主要内容,对ESO的收敛性分析进行说明。控制理论方面的论文喜欢利用微分方程(包括常微分方程和偏微分方程)作为工具进行数学公式推导,从这个角度来说,我一直将控制理论的研究等效描述成微分方程解的稳定性,过分关注数学模型也是导致控制理论和控制工程存在巨大gap很重要的原因,这里不展开说了,毕竟我们这里的关注重点是ESO论文的思路,为想自己撰写ADRC方面论文的读者提供借鉴和参考。

我们主要考虑如下 n n n阶常微分方程描述的模型(或者所谓的积分形式系统):

(1) { x ˙ 1 ( t ) = x 2 ( t ) ,    x 1 ( 0 ) = x 10 , x ˙ 2 ( t ) = x 3 ( t ) ,    x 2 ( 0 ) = x 20 , ⋮ x ˙ n ( t ) = f ( t , x 1 ( t ) , x 2 ( t ) , … , x n ( t ) ) + w ( t ) + u ( t ) ,    x n ( 0 ) = x n 0 , y ( t ) = x 1 ( t ) , \left\{\begin{aligned} &\dot{x}_1(t)=x_2(t),\;x_1(0)=x_{10},\\ &\dot{x}_2(t)=x_3(t),\;x_2(0)=x_{20},\\ &\vdots\\ &\dot{x}_n(t)=f(t,x_1(t),x_2(t),\ldots,x_n(t))+w(t)+u(t),\;x_n(0)=x_{n0},\\ &y(t)=x_1(t), \end{aligned}\right.\tag{1} x˙1(t)=x2(t),x1(0)=x10,x˙2(t)=x3(t),x2(0)=x20,x˙n(t)=f(t,x1(t),x2(t),,xn(t))+w(t)+u(t),xn(0)=xn0,y(t)=x1(t),(1)

其中, x 1 , … , x n x_1,\ldots,x_n x1,,xn为状态, u u u为控制输入, y y y为输出, f f f为未知非线性函数, w w w为外部干扰, x 10 , … , x n 0 x_{10},\ldots,x_{n0} x10,,xn0为状态初值,式(1)也称为单输入单输出系统。ESO将 f + w f+w f+w称为“总扰动”,并令 x n + 1 = f + w x_{n+1}=f+w xn+1=f+w x n + 1 x_{n+1} xn+1 称为扩张状态(即相对于原系统多出了一阶),进而设计观测器去估计这个扩张状态,这就是ESO名称的主要由来。为了理论推导可以继续,首先需要假设 可导,具体地,有

假设1 f f f w w w对各自的自变量连续可导,且有

∣ u ∣ + ∣ f ∣ + ∣ w ˙ ∣ + ∣ ∂ f ∂ t ∣ + ∑ i = 1 n ∣ ∂ f ∂ x i ∣ ≤ c 0 + ∑ j = 1 n c j ∣ x j ∣ k , \left\vert u\right\vert+\left\vert f\right\vert+\left\vert\dot{w}\right\vert+\left\vert\frac{\partial f}{\partial t}\right\vert +\sum\limits_{i=1}^{n}\left\vert\frac{\partial f}{\partial x_i}\right\vert\leq c_0+\sum\limits_{j=1}^{n}c_j\left\vert x_j\right\vert^k, u+f+w˙+tf+i=1nxifc0+j=1ncjxjk,

其中, c j c_j cj j = 0 , 1 , … , n j=0,1,\ldots,n j=0,1,,n为正常数, k k k为正整数。

在假设1的前提下,系统(1)可重新写为
(2) { x ˙ 1 ( t ) = x 2 ( t ) ,    x 1 ( 0 ) = x 10 , x ˙ 2 ( t ) = x 3 ( t ) ,    x 2 ( 0 ) = x 20 , ⋮ x ˙ n ( t ) = x n + 1 ( t ) ,    x n ( 0 ) = x n 0 , x ˙ n + 1 ( t ) = L ˙ ( t ) ,    x n + 1 ( 0 ) = L ( 0 ) , y ( t ) = x 1 ( t ) , \left\{\begin{aligned} &\dot{x}_1(t)=x_2(t),\;x_1(0)=x_{10},\\ &\dot{x}_2(t)=x_3(t),\;x_2(0)=x_{20},\\ &\vdots\\ &\dot{x}_n(t)=x_{n+1}(t),\;x_n(0)=x_{n0},\\ &\dot{x}_{n+1}(t)=\dot{L}(t),\;x_{n+1}(0)=L(0),\\ &y(t)=x_1(t), \end{aligned}\right.\tag{2} x˙1(t)=x2(t),x1(0)=x10,x˙2(t)=x3(t),x2(0)=x20,x˙n(t)=xn+1(t),xn(0)=xn0,x˙n+1(t)=L˙(t),xn+1(0)=L(0),y(t)=x1(t),(2)
其中, L ( t ) = f ( t , x 1 ( t ) , x 2 ( t ) , … , x n ( t ) ) + w ( t ) L(t)=f(t,x_1(t),x_2(t),\ldots,x_n(t))+w(t) L(t)=f(t,x1(t),x2(t),,xn(t))+w(t)。针对系统(2),ESO设计为如下形式:
(3) { x ^ ˙ 1 ( t ) = x ^ 2 ( t ) + ϵ n − 1 g 1 ( y ( t ) − x ^ 1 ( t ) ε n ) , x ^ ˙ 2 ( t ) = x ^ 3 ( t ) + ϵ n − 2 g 2 ( y ( t ) − x ^ 1 ( t ) ε n ) , ⋮ x ^ ˙ n ( t ) = x n + 1 ( t ) + g n ( y ( t ) − x ^ 1 ( t ) ε n ) + u ( t ) , x ^ ˙ n + 1 ( t ) = 1 ϵ g n + 1 ( y ( t ) − x ^ 1 ( t ) ε n ) , \left\{\begin{aligned} &\dot{\hat{x}}_1(t)=\hat{x}_2(t)+\epsilon^{n-1}g_1\left(\frac{y(t)-\hat{x}_1(t)}{\varepsilon^n}\right),\\ &\dot{\hat{x}}_2(t)=\hat{x}_3(t)+\epsilon^{n-2}g_2\left(\frac{y(t)-\hat{x}_1(t)}{\varepsilon^n}\right),\\ &\vdots\\ &\dot{\hat{x}}_n(t)=x_{n+1}(t)+g_n\left(\frac{y(t)-\hat{x}_1(t)}{\varepsilon^n}\right)+u(t),\\ &\dot{\hat{x}}_{n+1}(t)=\frac{1}{\epsilon}g_{n+1}\left(\frac{y(t)-\hat{x}_1(t)}{\varepsilon^n}\right), \end{aligned}\right.\tag{3} x^˙1(t)=x^2(t)+ϵn1g1(εny(t)x^1(t)),x^˙2(t)=x^3(t)+ϵn2g2(εny(t)x^1(t)),x^˙n(t)=xn+1(t)+gn(εny(t)x^1(t))+u(t),x^˙n+1(t)=ϵ1gn+1(εny(t)x^1(t)),(3)
其中, g i g_i gi i = 1 , 2 , … , n + 1 i=1,2,\ldots,n+1 i=1,2,,n+1为设计函数, ε \varepsilon ε为增益,当 g i g_i gi取线性形式时,即可得到扩张高增益观测器:
(4) { x ^ ˙ 1 ( t ) = x ^ 2 ( t ) + α 1 ϵ ( y ( t ) − x ^ 1 ( t ) ) , x ^ ˙ 2 ( t ) = x ^ 3 ( t ) + α 2 ϵ 2 ( y ( t ) − x ^ 1 ( t ) ) , ⋮ x ^ ˙ n ( t ) = x n + 1 ( t ) + α n ϵ n ( y ( t ) − x ^ 1 ( t ) ) + u ( t ) , x ^ ˙ n + 1 ( t ) = α n + 1 ϵ n + 1 ( y ( t ) − x ^ 1 ( t ) ) , \left\{\begin{aligned} &\dot{\hat{x}}_1(t)=\hat{x}_2(t)+\frac{\alpha_1}{\epsilon}\left(y(t)-\hat{x}_1(t)\right),\\ &\dot{\hat{x}}_2(t)=\hat{x}_3(t)+\frac{\alpha_2}{\epsilon^2}\left(y(t)-\hat{x}_1(t)\right),\\ &\vdots\\ &\dot{\hat{x}}_n(t)=x_{n+1}(t)+\frac{\alpha_n}{\epsilon^n}\left(y(t)-\hat{x}_1(t)\right)+u(t),\\ &\dot{\hat{x}}_{n+1}(t)=\frac{\alpha_{n+1}}{\epsilon^{n+1}}\left(y(t)-\hat{x}_1(t)\right), \end{aligned}\right.\tag{4} x^˙1(t)=x^2(t)+ϵα1(y(t)x^1(t)),x^˙2(t)=x^3(t)+ϵ2α2(y(t)x^1(t)),x^˙n(t)=xn+1(t)+ϵnαn(y(t)x^1(t))+u(t),x^˙n+1(t)=ϵn+1αn+1(y(t)x^1(t)),(4)
其中, α i \alpha_i αi i = 1 , 2 , … , n + 1 i=1,2,\ldots,n+1 i=1,2,,n+1为设计常数。

下面开始分析ESO(3)的收敛性,为此,进一步有下面两个假设,在后面可以看到作出这两个假设的作用,简单来说就是先用Lyapunov函数推导稳定性,然后发现如果不作这样的假设就推导不下去,因此就这样假设了(可以说这是大部分控制理论领域论文偏离工程实际的主要原因,一切为Lyapunov稳定性推导服务,最后演变成做数学习题模式,颇有自娱自乐之意):

假设2 w w w和系统(1)的解满足对各自的自变量连续可导,且对 i = 1 , 2 , … , n i=1,2,\ldots,n i=1,2,,n均有 ∣ w ∣ + ∣ x i ( t ) ∣ ≤ B \left\vert w\right\vert+\left\vert x_i(t)\right\vert\leq B w+xi(t)B B > 0 B>0 B>0为常数, t ≥ 0 t\geq 0 t0

假设3:存在常数 λ i ( i = 1 , 2 , 3 , 4 ) \lambda_i(i=1,2,3,4) λi(i=1,2,3,4) α \alpha α β \beta β和正定连续可微函数 V V V W W W R n + 1 → R \mathbb{R}^{n+1}\rightarrow\mathbb{R} Rn+1R使得

  • λ 1 ∥ y ∥ 2 ≤ V ( y ) ≤ λ 2 ∥ y ∥ 2 \lambda_1\Vert y\Vert^2\leq V(y)\leq\lambda_2\Vert y\Vert^2 λ1y2V(y)λ2y2 λ 3 ∥ y ∥ 2 ≤ W ( y ) ≤ λ 4 ∥ y ∥ 2 \lambda_3\Vert y\Vert^2\leq W(y)\leq\lambda_4\Vert y\Vert^2 λ3y2W(y)λ4y2
  • ∑ i = 1 n ∂ V ∂ y i ( y i + 1 − g i ( y 1 ) ) − ∂ V ∂ y n + 1 g n + 1 ( y 1 ) ≤ − W ( y ) \sum\limits_{i=1}^{n}\frac{\partial V}{\partial y_i}(y_{i+1}-g_i(y_1))- \frac{\partial V}{\partial y_{n+1}}g_{n+1}(y_1)\leq -W(y) i=1nyiV(yi+1gi(y1))yn+1Vgn+1(y1)W(y)
  • ∣ ∂ V ∂ y n + 1 ∣ ≤ β ∥ y ∥ \left\vert\frac{\partial V}{\partial y_{n+1}}\right\vert\leq\beta \Vert y\Vert yn+1Vβy

其中, y = ( y 1 , y 2 , … , y n + 1 ) y=(y_1,y_2,\ldots,y_{n+1}) y=(y1,y2,,yn+1) ∥ ⋅ ∥ \Vert\cdot\Vert 为Euclid范数。

下面就可以提出定理了(控制理论论文的通常模式就是提出一个定理,然后用大量篇幅去证明,各种秀公式,当然,为了使得公式能秀下去,先在前面作出一大堆假设,事实上,一般是先推导,根据推导进行的程度作出假设,因此可以说是先有证明,后有假设)。

定理1:若假设1-假设3成立,则有
(i) 对每一个正常数 a a a lim ⁡ ε → 0 ∣ x i ( t ) − x ^ i ( t ) ∣ = 0 \lim\limits_{\varepsilon\rightarrow 0}\vert x_i(t)-\hat{x}_i(t)\vert=0 ε0limxi(t)x^i(t)=0 t ∈ [ a , ∞ ) t\in[a,\infty) t[a,)一致成立;
(ii) lim ⁡ t → ∞ ∣ x i ( t ) − x ^ i ( t ) ∣ ≤ O ( ε n + 2 − i ) \lim\limits_{t\rightarrow \infty}\vert x_i(t)-\hat{x}_i(t)\vert\leq O(\varepsilon^{n+2-i}) tlimxi(t)x^i(t)O(εn+2i)
其中, x i x_i xi x ^ i \hat{x}_i x^i分别为系统(1)和ESO(3)的解, i = 1 , 2 , … , n + 1 i=1,2,\ldots,n+1 i=1,2,,n+1 x n + 1 = f + w x_{n+1}=f+w xn+1=f+w为系统(1)的扩张状态。

证明:首先分析 L ˙ ( t ) \dot{L}(t) L˙(t)(或者说是 x ˙ n + 1 ( t ) \dot{x}_{n+1}(t) x˙n+1(t))的有界性,写出其表达式且变换时间坐标,有
(5) Δ ( t ) = d d s f ( s , x 1 ( s ) , … , x n ( s ) ) ∣ s = ε t + w ˙ ( ε t ) = ∂ ∂ t f ( ε t , x 1 ( ε t ) , … , x n ( ε t ) ) + ∑ i = 1 n x i + 1 ( ε t ) ∂ ∂ x i f ( ε t , x 1 ( ε t ) , … , x n ( ε t ) ) + u ( ε t ) ∂ ∂ x n f ( ε t , x 1 ( ε t ) , … , x n ( ε t ) ) + w ˙ ( ε t ) . \begin{aligned} \Delta(t)=&\left.\frac{\mathrm{d}}{\mathrm{d}s}f(s,x_1(s),\ldots,x_n(s))\right|_{s=\varepsilon t}+\dot{w}(\varepsilon t)\\ =&\frac{\partial}{\partial t}f(\varepsilon t,x_1(\varepsilon t),\ldots,x_n(\varepsilon t)) +\sum_{i=1}^{n}x_{i+1}(\varepsilon t)\frac{\partial}{\partial x_i}f(\varepsilon t,x_1(\varepsilon t),\ldots,x_n(\varepsilon t))\\ &+u(\varepsilon t)\frac{\partial}{\partial x_n}f(\varepsilon t,x_1(\varepsilon t),\ldots,x_n(\varepsilon t)) +\dot{w}(\varepsilon t). \end{aligned}\tag{5} Δ(t)==dsdf(s,x1(s),,xn(s))s=εt+w˙(εt)tf(εt,x1(εt),,xn(εt))+i=1nxi+1(εt)xif(εt,x1(εt),,xn(εt))+u(εt)xnf(εt,x1(εt),,xn(εt))+w˙(εt).(5)

发现了没有? Δ ( t ) \Delta(t) Δ(t)其实就是 L ( t ) L(t) L(t)(或者说是 x n + 1 ( t ) x_{n+1}(t) xn+1(t))在 ε t \varepsilon t εt处导数的取值。根据假设1和假设2,只要 ε \varepsilon ε为正,不管 ε \varepsilon ε取值多小, Δ ( t ) \Delta(t) Δ(t)都是有界的,也就是说存在 ε \varepsilon ε和无关的正常数 M > 0 M>0 M>0使得 ∥ Δ ( t ) ∥ ≤ M \Vert\Delta (t)\Vert\leq M Δ(t)M对所有 t ≥ 0 t\geq 0 t0均成立。注意到“不确定项 L ( t ) L(t) L(t)导数的界和 Δ ( t ) \Delta(t) Δ(t)无关”这个性质相当重要,是证明ESO收敛和整个ADRC稳定的关键,该性质表明,在Lyapunov稳定性框架下,理论上可以通过任意改变 ε \varepsilon ε的取值(前提是 ε \varepsilon ε为正)来压缩与不确定项有关的交叉项来使得闭环系统稳定,在下面的分析中可以很明显地看到这一点。

既然要分析ESO的收敛性,自然要看估计误差的表现,因此定义

(6) e i ( t ) = x i ( t ) − x ^ i ( t ) ,    η i ( t ) = e i ( ε t ) ε n + 1 − i ,    i = 1 , 2 , … , n + 1 , e_i(t)=x_i(t)-\hat{x}_i(t),\;\eta_i(t)=\frac{e_i(\varepsilon t)}{\varepsilon^{n+1-i}},\;i=1,2,\ldots,n+1,\tag{6} ei(t)=xi(t)x^i(t),ηi(t)=εn+1iei(εt),i=1,2,,n+1,(6)

其中,定义 η i ( t ) \eta_i(t) ηi(t)的技巧来自于文献[4],这里对时间坐标稍作改变,不影响实质,或者说 e i ( t ) e_i(t) ei(t)是直接的估计误差,而 η i ( t ) \eta_i(t) ηi(t)则是处于收敛性分析需要而定义的一种尺度化估计误差,令 η = [ η 1 , η 2 , … , η n + 1 ] T \eta=[\eta_1,\eta_2,\ldots,\eta_{n+1}]^\mathrm{T} η=[η1,η2,,ηn+1]T,写出 η \eta η系统应满足的微分方程,则有

(7) { η ˙ 1 ( t ) = η 2 ( t ) − g 1 ( η 1 ( t ) ) , η 1 ( 0 ) = e 1 ( 0 ) ε n , η ˙ 2 ( t ) = η 3 ( t ) − g 2 ( η 1 ( t ) ) , η 2 ( 0 ) = e 2 ( 0 ) ε n − 1 , ⋮ η ˙ n ( t ) = η n + 1 ( t ) − g n ( η 1 ( t ) ) , η n ( 0 ) = e n ( 0 ) ε , η ˙ n + 1 ( t ) = − g n + 1 ( η 1 ( t ) ) + ε Δ ( t ) , η n + 1 ( 0 ) = e n + 1 ( 0 ) . \left\{\begin{aligned} &\dot{\eta}_1(t)=\eta_2(t)-g_1(\eta_1(t)),\eta_1(0)=\frac{e_1(0)}{\varepsilon^n},\\ &\dot{\eta}_2(t)=\eta_3(t)-g_2(\eta_1(t)),\eta_2(0)=\frac{e_2(0)}{\varepsilon^{n-1}},\\ &\vdots\\ &\dot{\eta}_n(t)=\eta_{n+1}(t)-g_n(\eta_1(t)),\eta_n(0)=\frac{e_n(0)}{\varepsilon},\\ &\dot{\eta}_{n+1}(t)=-g_{n+1}(\eta_1(t))+\varepsilon\Delta(t),\eta_{n+1}(0)=e_{n+1}(0). \end{aligned}\right.\tag{7} η˙1(t)=η2(t)g1(η1(t)),η1(0)=εne1(0),η˙2(t)=η3(t)g2(η1(t)),η2(0)=εn1e2(0),η˙n(t)=ηn+1(t)gn(η1(t)),ηn(0)=εen(0),η˙n+1(t)=gn+1(η1(t))+εΔ(t),ηn+1(0)=en+1(0).(7)

现在可以看到假设3的作用了,假设3是在Lyapunov稳定性框架下作出的,即相当于认为一旦设计选取的函数 g i g_i gi i = 1 , 2 , … , n + 1 i=1,2,\ldots,n+1 i=1,2,,n+1确定好以后,就存在一个合适的Lyapunov函数 V V V,使得该Lyapunov函数 V V V沿着 η \eta η系统的导数满足一定性质,这是Lyapunov稳定性证明的常用套路。有些论文为了所谓的严谨性,会在证明中说选取一个准Lyapunov函数,因为它们认为只有最后证明了一个函数沿系统的导数满足Lyapunov稳定性框架下的性质,才能称之为Lyapunov函数,不过这也只是玩玩文字游戏罢了,不改变问题实质。为了在理论上凸显逼格,这里没有限定 g i g_i gi的具体形式,因此也无法给出Lyapunov函数的一般形式。根据假设3,可以得到

(8) d d t V ( η ( t ) ) = ∑ i = 1 n ∂ V ∂ η i ( η i + 1 − g i ( η 1 ) ) − ∂ V ∂ η n + 1 g n + 1 ( η 1 ) + ∂ V ∂ η n + 1 ε Δ ≤ − W ( η ) + ε M β ∥ η ∥ ≤ − λ 3 λ 2 V ( η ) + λ 1 λ 1 ε M β V ( η ) . \begin{aligned}\frac{\mathrm{d}}{\mathrm{d}t}V(\eta(t)) =&\sum_{i=1}^{n}\frac{\partial V}{\partial \eta_i}(\eta_{i+1}-g_i(\eta_1)) -\frac{\partial V}{\partial \eta_{n+1}}g_{n+1}(\eta_1) +\frac{\partial V}{\partial \eta_{n+1}}\varepsilon\Delta\\ \leq&-W(\eta)+\varepsilon M\beta\Vert\eta\Vert \leq-\frac{\lambda_3}{\lambda_2}V(\eta)+\frac{\sqrt{\lambda_1}}{\lambda_1}\varepsilon M\beta\sqrt{V(\eta)}.\end{aligned}\tag{8} dtdV(η(t))=i=1nηiV(ηi+1gi(η1))ηn+1Vgn+1(η1)+ηn+1VεΔW(η)+εMβηλ2λ3V(η)+λ1λ1 εMβV(η) .(8)

根据 V ( η ( t ) ) \sqrt{V(\eta(t))} V(η(t)) V ( η ( t ) ) V(\eta(t)) V(η(t))的关系,进一步有

(9) d d t V ( η ( t ) ) ≤ − λ 3 2 λ 2 V ( η ( t ) ) + λ 1 ε M β 2 λ 1 . \frac{\mathrm{d}}{\mathrm{d}t}\sqrt{V(\eta(t))} \leq -\frac{\lambda_3}{2\lambda_2}\sqrt{V(\eta(t))}+\frac{\sqrt{\lambda_1}\varepsilon M\beta}{2\lambda_1}.\tag{9} dtdV(η(t)) 2λ2λ3V(η(t)) +2λ1λ1 εMβ.(9)

再一次根据假设3,有

(10) ∥ η ( t ) ∥ ≤ V ( η ( t ) ) λ 1 ≤ λ 1 V ( η ( 0 ) ) λ 1 e − λ 3 2 λ 2 t + ε M β 2 λ 1 ∫ 0 t e − λ 3 2 λ 2 ( t − s ) d s . \Vert\eta(t)\Vert\leq\sqrt{\frac{V(\eta(t))}{\lambda_1}} \leq\frac{\sqrt{\lambda_1V(\eta(0))}}{\lambda_1}\mathrm{e}^{-\frac{\lambda_3}{2\lambda_2}t} +\frac{\varepsilon M\beta}{2\lambda_1}\int_{0}^{t}\mathrm{e}^{-\frac{\lambda_3}{2\lambda_2}(t-s)}\mathrm{d}s.\tag{10} η(t)λ1V(η(t)) λ1λ1V(η(0)) e2λ2λ3t+2λ1εMβ0te2λ2λ3(ts)ds.(10)

最后根据 η ( t ) \eta(t) η(t) e ( t ) e(t) e(t)的关系可得

(11) ∣ e i ( t ) ∣ = ε n + 1 − i ∣ η i ( t ε ) ∣ ≤ ε n + 1 − i ∥ η ( t ε ) ∥ ≤ ε n + 1 − i [ λ 1 V ( η ( 0 ) ) λ 1 e − λ 3 t 2 λ 2 ε + ε M β 2 λ 1 ∫ 0 t ε e − λ 3 2 λ 2 ( t / ε − s ) d s ] . \begin{aligned} \vert e_i(t)\vert&=\varepsilon^{n+1-i}\left\vert\eta_i\left(\frac{t}{\varepsilon}\right)\right\vert \leq\varepsilon^{n+1-i}\left\Vert\eta\left(\frac{t}{\varepsilon}\right)\right\Vert\\ &\leq\varepsilon^{n+1-i}\left[ \frac{\sqrt{\lambda_1V(\eta(0))}}{\lambda_1}\mathrm{e}^{-\frac{\lambda_3 t}{2\lambda_2\varepsilon}} +\frac{\varepsilon M\beta}{2\lambda_1}\int_{0}^{\frac{t}{\varepsilon}}\mathrm{e}^{-\frac{\lambda_3}{2\lambda_2}(t/\varepsilon-s)}\mathrm{d}s\right].\end{aligned}\tag{11} ei(t)=εn+1iηi(εt)εn+1iη(εt)εn+1i[λ1λ1V(η(0)) e2λ2ελ3t+2λ1εMβ0εte2λ2λ3(t/εs)ds].(11)

可见对 t ∈ [ a , ∞ ) t\in[a,\infty) t[a,),当 ε → 0 \varepsilon\rightarrow 0 ε0 ∣ e i ( t ) ∣ → 0 \vert e_i(t)\vert\rightarrow 0 ei(t)0一致成立,定理1的两个结论都可以从上式推得,证毕。

需要说明的是,当 g i g_i gi取为线性形式时,Lyapunov函数可以取为 系统状态的二次函数,因为此时 η \eta η系统可以写为

(12) { η ˙ 1 ( t ) = η 2 ( t ) − α 1 η 1 ( t ) , η 1 ( 0 ) = e 1 ( 0 ) ε n , η ˙ 2 ( t ) = η 3 ( t ) − α 2 η 1 ( t ) , η 2 ( 0 ) = e 2 ( 0 ) ε n − 1 , ⋮ η ˙ n ( t ) = η n + 1 ( t ) − α n η 1 ( t ) , η n ( 0 ) = e n ( 0 ) ε , η ˙ n + 1 ( t ) = − α n + 1 η 1 ( t ) + ε Δ ( t ) , η n + 1 ( 0 ) = e n + 1 ( 0 ) . \left\{\begin{aligned} &\dot{\eta}_1(t)=\eta_2(t)-\alpha_1\eta_1(t),\eta_1(0)=\frac{e_1(0)}{\varepsilon^n},\\ &\dot{\eta}_2(t)=\eta_3(t)-\alpha_2\eta_1(t),\eta_2(0)=\frac{e_2(0)}{\varepsilon^{n-1}},\\ &\vdots\\ &\dot{\eta}_n(t)=\eta_{n+1}(t)-\alpha_n\eta_1(t),\eta_n(0)=\frac{e_n(0)}{\varepsilon},\\ &\dot{\eta}_{n+1}(t)=-\alpha_{n+1}\eta_1(t)+\varepsilon\Delta(t),\eta_{n+1}(0)=e_{n+1}(0). \end{aligned}\right.\tag{12} η˙1(t)=η2(t)α1η1(t),η1(0)=εne1(0),η˙2(t)=η3(t)α2η1(t),η2(0)=εn1e2(0),η˙n(t)=ηn+1(t)αnη1(t),ηn(0)=εen(0),η˙n+1(t)=αn+1η1(t)+εΔ(t),ηn+1(0)=en+1(0).(12)

此时,只要如下矩阵为Hurwitz:

(13) E = [ − α 1 1 0 ⋯ 0 − α 2 0 1 ⋯ 0 ⋮ ⋮ ⋮ ⋱ ⋮ − α n 0 0 ⋯ 1 − α n + 1 0 0 ⋯ 0 ] , E=\left[\begin{matrix} -\alpha_1 & 1 & 0 & \cdots & 0\\ -\alpha_2 & 0 & 1 & \cdots & 0\\ \vdots & \vdots & \vdots &\ddots &\vdots\\ -\alpha_n & 0 & 0 & \cdots & 1\\ -\alpha_{n+1} & 0 & 0 & \cdots & 0\\ \end{matrix}\right],\tag{13} E=α1α2αnαn+1100001000010,(13)

P P P为满足Lyapunov方程 P E + E T P = − I PE+E^\mathrm{T}P=-I PE+ETP=I的正定矩阵, I I I n + 1 n+1 n+1维单位矩阵,则假设3中的函数 V V V W W W R n + 1 → R \mathbb{R}^{n+1}\rightarrow\mathbb{R} Rn+1R可以定义为

(14) V ( η ) = η T P η ,      W ( η ) = η T η ,      ∀ η ∈ R n + 1 . V(\eta)=\eta^\mathrm{T}P\eta,\;\;W(\eta)=\eta^\mathrm{T}\eta,\;\;\forall \eta\in\mathbb{R}^{n+1}.\tag{14} V(η)=ηTPη,W(η)=ηTη,ηRn+1.(14)

则有
λ min ⁡ ( P ) ∥ η ∥ 2 ≤ V ( η ) ≤ λ max ⁡ ( P ) ∥ η ∥ 2 , \lambda_{\min}(P)\Vert\eta\Vert^2\leq V(\eta)\leq\lambda_{\max}(P)\Vert\eta\Vert^2, λmin(P)η2V(η)λmax(P)η2,

∑ i = 1 n ∂ V ∂ η i ( η i + 1 − α i η 1 ) − ∂ V ∂ η n + 1 α n + 1 η 1 = − η T η = − ∥ η ∥ 2 = − W ( y ) , \sum_{i=1}^{n}\frac{\partial V}{\partial \eta_i}(\eta_{i+1}-\alpha_i\eta_1)- \frac{\partial V}{\partial \eta_{n+1}}\alpha_{n+1}\eta_1 =-\eta^\mathrm{T}\eta=-\Vert\eta\Vert^2=-W(y), i=1nηiV(ηi+1αiη1)ηn+1Vαn+1η1=ηTη=η2=W(y),

以及

∣ ∂ V ∂ η n + 1 ∣ ≤ ∥ ∂ V ∂ η ∥ = ∥ 2 η T P ∥ ≤ 2 ∥ P ∥ ∥ η ∥ = 2 λ max ⁡ ( P ) ∥ η ∥ , \left\vert\frac{\partial V}{\partial \eta_{n+1}}\right\vert \leq\left\Vert\frac{\partial V}{\partial \eta}\right\Vert =\Vert2\eta^\mathrm{T}P\Vert\leq 2\Vert P\Vert \Vert\eta\Vert =2\lambda_{\max}(P)\Vert \eta\Vert, ηn+1VηV=2ηTP2Pη=2λmax(P)η,

其中, λ max ⁡ ( P ) \lambda_{\max}(P) λmax(P) λ min ⁡ ( P ) \lambda_{\min}(P) λmin(P)分别为 P P P的最大和最小特征值。可见此时假设3中的条件是满足的,因此对于线性形式的ESO可以直接利用上面的证明过程得到收敛性结论。

到这里,关于ESO的收敛性分析已经完成了第一部分,文献[2]进一步放宽了假设3的条件,将ESO的收敛性分析进行推广,而文献[3]则进一步考虑了下三角形式系统的ESO设计和收敛性分析,我们将在下一篇博客中再详细分析。

参考文献

[1]韩京清. 自抗扰控制技术: 估计补偿不确定因素的控制技术[M]. 国防工业出版社, 2008.

[2]Guo B Z, Zhao Z. On the convergence of an extended state observer for nonlinear systems with uncertainty[J]. Systems & Control Letters, 2011, 60(6): 420-430.

[3]Zhao Z L, Guo B Z. Extended state observer for uncertain lower triangular nonlinear systems[J]. Systems & Control Letters, 2015, 85: 100-108.

[4]Khalil H K. Nonlinear systems[M]. Prentice-Hall, 2001.

[5]Freidovich L B, Khalil H K. Performance recovery of feedback-linearization-based designs[J]. IEEE Transactions on automatic control, 2008, 53(10): 2324-2334.

  • 11
    点赞
  • 8
    评论
  • 36
    收藏
  • 一键三连
    一键三连
  • 扫一扫,分享海报

相关推荐
韦东山老师为啥要录升级版嵌入式视频?<br /><br /> 200x年左右,嵌入式Linux在全世界、在国刚刚兴起。<br /> 我记得我2005年进入兴时,全部门人正在努力学习Linux。<br /> 在2008年,我写了一本书《嵌入式Linux应用开发完全手册》。<br /> 它大概内容是:裸机、U-boot、Linux内核、Linux设备驱动。<br /> 那时还没有这样讲解整个系统书,<br /> 芯片厂家Linux开发包也还不完善,从bootloader到内核,再到设备驱动都不完善。<br /> 有全系统开发能力人也很少。<br /> 于是这书也就恰逢其时,变成了畅销书。<br /> 我也根据这个思路录制了视频:裸机、U-boot、Linux内核、Linux设备驱动。<br /> 收获些许名声,带领很多人进入Linux世界。<br /><br /><strong>11年过去了,嵌入式Linux世界发生了翻天覆地变化</strong><br /><br /> ① 基本系统能用<br /><br /> 芯片厂家都会提供完整U-boot、Linux内核、芯片上硬件资源驱动。<br /> 方案厂家会做一些定制,比如加上某个WIFI模块,会添加这个WIFI模块驱动。<br /> 你可以使用厂家原始方案,或是使用/借鉴方案商方案,做出一个“能用”产品。<br /><br /> ② 基础驱动弱化;高级驱动专业化<br /><br /> 基础驱动,比如GPIO、UART、SPI、I2C、LCD、MMC等,有了太多书籍、视频、示例代码,修修改改总是可以用。<br /> 很多所谓驱动工程师,实际上就是“调参工程师”。<br /> 我们群里有名火哥,提出了一个概念:这些驱动就起一个“hardware enable”作用。<br /> 高级驱动,比如USB、PCIE、HDMI、MIPI、GPU、WIFI、蓝牙、摄像头、声卡。<br /><br /> 体系非常复杂,很少有人能讲清楚,很多时候只是一笔带过。<br /> 配置一下应用层工具就了事,能用就成。<br /> 这些高级驱动,工作需要专门人来负责,非常专业。<br /> 他们是某一块专家,比如摄像头专家、音频专家。<br /><br /> ③ 项目为王<br /> 你到一个公司,目是把产品做出来,会涉及APP到内核到驱动全流程。<br /> 小公司玩不起华为配置,需要是全面手。<br /> 大公司里,只负责很小很小一块镙丝钉,位置也不太稳固啊。<br /> 所以,如果你不是立志成为某方面专家,那就做一个全栈工程师吧。<br /><br /> ④ 调试很重要<br /> 都说代码是3分写7分调,各种调试调优技术,可以为你升职加薪加一把火。<br /> 基于上述4点,我录制全新视频将有这些特点:<br /> 1. 快速入门,<br /> 2. 实战项目,<br /> 3. 驱动大全,<br /> 4. 专题,<br /> 5. 授人以渔,<br /> 6. 要做任务<br /> 另外,我们会使用多款芯片同时录制,先讲通用原理,再单独讲各个板子操作。<br /> 这些芯片涵盖主流芯片公司主流芯片,让你学习工作无缝对接。<br /><img src="https://img-bss.csdn.net/201911180753564269.jpg" alt="" /><br /><br /><br /><br /> 1.快速入门<br /> 入门讲究是快速,入门之后再慢慢深入,<br /> 特别是对于急着找工作学生,对于业余时间挑灯夜读工作了人,一定要快!<br /> 再从裸机、U-boot、内核、驱动这样路线学习就不适合了,时间就拉得太长了。<br /> 搞不好学了后面忘了前面。<br /> 并且实际工作并不需要你去弄懂U-boot,会用就行:U-boot比驱动还复杂。<br /><br /> 讲哪些内容?<br /><img src="https://img-bss.csdn.net/201911180754297078.png" alt="" /><br /><br /> 怎么讲呢?<br /><br /> 混着讲<br /> 比如先讲LED APP,知道APP怎么调用驱动,再讲LED硬件原理和裸机,最后讲驱动编写。<br /> 这样可以快速掌握嵌入式Linux整套开发流程,<br /> 不必像以前那样光学习裸机就花上1、2个月。<br /> 而里面裸机课程,也会让你在掌握硬件操作同时,把单片机也学会了。<br /><br /> 讲基础技能<br /><br /> 断、休眠-唤醒、异步通知、阻塞、内存映射等等机制,会配合驱动和APP来讲解。<br /> 这些技能是嵌入式Linux开发基础。<br /> 而这些驱动,只会涉及LED、按制、LCD等几个驱动。<br /> 掌握了这些输入、输出驱动和对应APP后,你已经具备基本开发能力了。<br /><br /> 讲配置<br /> 我们从厂家、从方案公司基本上都可以拿到一套完整开发环境,怎么去配置它?<br /> 需要懂shell和python等配置脚本。<br /><br /><br /> 效果效率优先<br /> 以前我都是现场写代码、现场写文档,字写得慢,降低了学习效率。<br /> 这次,效果与效率统一考虑,不再追求所有东西都现场写。<br /> 容易地方可先写好代码文档,难地方现场写。<br /><br /> 2.实战项目<br /> 会讲解这样涉及linux网关/服务器相关项目(不限于,请多提建议):<br />  <img src="https://img-bss.csdn.net/201911180754541383.jpg" alt="" />            <br />       <br /> 定位为:快速掌握项目开发经验,丰满简历。<br /> 涉及每一部分都会讲,比如如果涉及蓝牙,在这里只会讲怎么使用,让你能写出程序;如果要深入,可以看后面蓝牙专题。<br /><br /> 3. 驱动大全<br /> 包括基础驱动、高级驱动。<br /> 这些驱动都是独立成章,深入讲解。<br /> 虽然基础驱动弱化了,但是作为Linux系统开发人员,这是必备技能,并且从驱动去理解内核是一个好方法。<br /> 在讲解这些驱动时,会把驱动运行环境,比如内核调度,进程线程等概念也讲出来,这样就可以搭建一个知识体系。<br /> 没有这些知识体系话,对驱动理解就太肤浅了,等于在Linux框架下写裸机,一叶障目,不见泰山。<br /> 定位为:工具、字典,用到再学习。<br /><br /> 4. 专题<br /> 想深入学习任何内容,都可独立为专题。<br /> 比如U-boot专题、内核内存管理专题、systemtap调试专题。<br />
©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值