Control-模型参考自适应控制(MRAC)

自适应控制可以在系统老化或者存在建模不确定性的情况下改善控制系统性能。自适应控制是一类处理不确定性系统的非线性控制方法,这些不确定性可能来自系统的动力学自身无法预见的变化或者外部的干扰。自适应控制系统可以广义地描述为能够基于被控对象所接受到的输入在线控制器设计参数,如控制增益,以适应系统不确定性的一种控制系统。其中,将可调参数成为自适应参数,将通过一组数学方程进行描述的调整机制称为自适应律。大多数情况下,典型的自适应律是非线性的。

自适应控制的历史可以追溯到20世纪50年代初,但自适应控制由于其固有的非线性特性并没有得到广泛应用。60年代,现代控制理论和李雅普诺夫稳定性理论的出现促成了自适应控制理论的发展。 W h i t a k e r Whitaker Whitaker等人利用灵敏度方法和 M I T MIT MIT法则设计出了模型参考自适应控制,但是缺乏对自适应控制自身特性的理解和稳定性证明。70年代,李雅普诺夫稳定性理论成为模型参考自适应控制的理论基础,李雅普诺夫稳定性理论与模型参考自适应控制的结合被视为自适应控制理论领域的一大突破。80年代,发现即使李雅普诺夫稳定性理论能够保证自适应控制的稳定性,但面对存在小扰动或者未建模动态的情况时,自适应控制仍可能表现出不稳定的现象,即模型参考自适应控制对系统建模精度及实际系统与所建模型之间的不匹配和敏感。这种缺乏鲁棒性的表现,催生了 σ \sigma σ修正法和 e e e修正法,以提升自使应控制的稳定性,这些鲁棒修正模式也代表了一类新的“鲁棒自适应控制”。90年代后,引入神经网络作为自适应机制。

尽管自适应控制领域已经研究了五十余年,但还没有任何自适应控制系统应用在安全至上或者人在回路的生产系统中,如民航客机等,但已应用在武器系统。造成这一现状的问题在于自适应控制系统很难进行认证,并且现有的线性时不变控制系统的认证方法无法直接应用于非线性自适应控制系统,即自适应控制系统设计缺乏公认的性能指标是其无法得到广泛认可的主要障碍。

模型参考自适应控制是比较流行的自适应控制方式之一,主要有两类设计方法:一种是基于局部参数最优化的设计方法( M I T MIT MIT);一种是基于稳定性理论( L y a p u n o v Lyapunov Lyapunov)的设计方法。

模型参考自适应控制系统结构

模型参考自适应控制系统的典型结构如下图所示,系统由参考模型、控制器和自适应率组成。

  • 控制器包括被控对象的前馈控制器和反馈控制器,可以根据自适应率进行调整;
  • 参考模型实际上是一种理想控制系统,其输出代表了期望的性能,对调节系统的特性要求,如超调量、阻尼时间等等;
  • 自适应率用来消除被控对象输出和参考模型期望输出的误差,改变控制器参数或者生成辅助输入。
    在这里插入图片描述

1 M I T MIT MIT法则

局部参数最优化方法的设计思想:系统包含若干可调节参数(如可调增益等),当被控对象的特性由于外界环境条件的改变或者其他干扰的影响而发生变化时,自适应率对这些可调参数进行调整,以补偿外界环境或者其他干扰对系统性能的影响,从而使参考模型和被控对象的误差构成的性能指标到达或者接近最小值,因此它的设计原理就是构造一个由误差和可调参数组成的目标函数,并把它视为可调参数空间中的一个超曲面,利用参数最优化方法使这个目标函数逐渐减小或者位于最小值的某个领域为止,从而满足被控对象和参考模型之间一致性要求。这种自适应规律最先由麻省理工学院提出的,故又称 M I T MIT MIT自适应规律。

几点假设:

  • 参考模型是时不变系统;

  • 参考模型和被控对象是线性的,有时为了分析方便假设阶次相同;

  • 参考模型和被控对象的误差可观测;

  • 在自适应控制过程中,可调参数或者辅助信号仅依赖于自适应率。由于环境干扰引起的系统参数变化相对于自适应率调节速度要慢很多,因此自适应率调节速度快于被控对象参数变化的速度,否则不能实现渐进自适应;

  • 可调系统参数已位于参考模型参数的某个领域内(局部),例如系统参数开始处于正常工作状态,受到小的扰动后偏离正常状态不太远的情况;

  • 相对于系统的内部动力学时间尺度而言,可调参数速度低,即自适应增益小。

1.1 被控对象模型

假设被控对象的传递函数为:
W p ( s ) = N ( s ) D ( s ) K p (1-1) W_p(s) = \frac{N(s)}{D(s)}K_p \tag{1-1} Wp(s)=D(s)N(s)Kp(1-1)
其中, D ( s ) D(s) D(s) N ( s ) N(s) N(s)为已知常系数多项式, K p > 0 K_p > 0 Kp>0 为被控对象增益。

1.2 参考模型

构造理想参考模型的传递函数为:
W ( s ) = N ( s ) D ( s ) K m (1-2) W(s) = \frac{N(s)}{D(s)}K_m \tag{1-2} W(s)=D(s)N(s)Km(1-2)
其中, K m K_m Km是已知常数,由期望的动态响应决定。

1.3 控制系统

当系统受到干扰时,被控对象的增益 K p K_p Kp可能发生变化,使其与参考模型的动态特性之间发生偏离,且 K p K_p Kp的变化是不可观测的。为了克服由 K p K_p Kp的漂移造成的影响,在控制系统中设置可调增益 K c K_c Kc来补偿由 K p K_p Kp变化造成的影响,期望使得 K c K_c Kc K p K_p Kp的乘积与参考模型的 K m K_m Km始终一致。

1.4 自适应率

定义参考模型和被控对象的误差为:
e = y m − y (1-3) e = y_m - y \tag{1-3} e=ymy(1-3)
其中, y m y_m ym为理想参考模型的输出, y y y为被控对象的输出, e e e表示输入信号为 r ( t ) r(t) r(t)时,理想系统的响应和实际系统响应之间的偏差。

确定可调增益 K c ( t ) K_c(t) Kc(t)的自适应调节率,使得下列性能指标最小:
J = 1 2 ∫ t 0 t e 2 ( τ , K c )    d τ (1-4) J = \frac{1}{2} \int_{t_0}^{t} e^2(\tau,K_c) \; d \tau \tag{1-4} J=21t0te2(τ,Kc)dτ(1-4)
采用梯度下降法来寻求 K c ( t ) K_c(t) Kc(t)的最优调节率。根据梯度下降理论 K c K_c Kc 的变化量 Δ K c \Delta K_c ΔKc应该正比于函数 J J J的负梯度方向:
Δ K c = − η ∂ J ∂ K c = − η ∫ t 0 t e ∂ e ∂ K c    d τ (1-5) \Delta K_c = - \eta \frac{\partial J}{\partial K_c} = - \eta \int_{t_0}^{t} e \frac{\partial e}{\partial K_c} \; d \tau \tag{1-5} ΔKc=ηKcJ=ηt0teKcedτ(1-5)
其中, η > 0 \eta > 0 η>0 ,则调整后的 K c K_c Kc为:
K c = Δ K c + K c 0 = − η ∫ t 0 t e ∂ e ∂ K c    d τ + K c 0 (1-6) K_c = \Delta K_c + K_{c0} = - \eta \int_{t_0}^{t} e \frac{\partial e}{\partial K_c} \; d \tau + K_{c0} \tag{1-6} Kc=ΔKc+Kc0=ηt0teKcedτ+Kc0(1-6)
将上式对时间求导数,得到 K c K_c Kc的变化率与误差 e e e的关系为:
K c ˙ = − η e ∂ e ∂ K c (1-7) \dot{K_c} =- \eta e \frac{\partial e}{\partial K_c} \tag{1-7} Kc˙=ηeKce(1-7)
参考输入 R ( s ) R(s) R(s)到输出偏差 E ( s ) E(s) E(s)的传递函数为:
W e ( s ) = E ( s ) R ( s ) = ( K m − K c K p ) N ( s ) D ( s ) (1-8) W_e(s) = \frac{E(s)}{R(s)}=(K_m-K_c K_p) \frac{N(s)}{D(s)} \tag{1-8} We(s)=R(s)E(s)=(KmKcKp)D(s)N(s)(1-8)
将上述拉普拉斯变化为微分方程描述的时域算子形式,即令:
p = d d t ,    p 2 = d 2 d t 2 ,    ⋯   ,    p n = d n d t n (1-9) p=\frac{d}{dt},\; p^2=\frac{d^2}{dt^2},\;\cdots,\;p^n=\frac{d^n}{dt^n} \tag{1-9} p=dtd,p2=dt2d2,,pn=dtndn(1-9)
则可得到满足 e e e所满足的微分方程为:
D ( p ) e ( t ) = ( K m − K c K p ) N ( p ) r ( t ) (1-10) D(p)e(t)=(K_m - K_c K_p)N(p)r(t) \tag{1-10} D(p)e(t)=(KmKcKp)N(p)r(t)(1-10)
上式两段对 K c K_c Kc求导数:
D ( p ) ∂ e ∂ K c = − K p N ( p ) r ( t ) (1-11) D(p) \frac{\partial e}{\partial K_c}=-K_pN(p)r(t) \tag{1-11} D(p)Kce=KpN(p)r(t)(1-11)
另一方面,考虑到参考模型的输出和输入之间满足下列关系:
D ( p ) y m ( t ) = K m N ( p ) r ( t ) (1-12) D(p)y_m(t)=K_m N(p) r(t) \tag{1-12} D(p)ym(t)=KmN(p)r(t)(1-12)
公式(1-11)与(1-12)相除得:
∂ e ∂ K c = − K p K m y m (1-13) \frac{\partial e}{\partial K_c} = -\frac{K_p}{K_m} y_m \tag{1-13} Kce=KmKpym(1-13)
将公式(1-13)代入(1-7)得:
K c ˙ = η K p K m y m e (1-14) \dot{K_c} = \eta \frac{K_p}{K_m} y_me \tag{1-14} Kc˙=ηKmKpyme(1-14)
因此综合出来的模型参考闭环自适应系统的数学模型可用下列一组方程来描述:
{ D ( p ) e ( t ) = ( k m − K c K p ) N ( p ) r ( t ) D ( p ) y m ( t ) = K m N ( p ) r ( t ) K c ˙ = η K p K m y m e (1-15) \begin{cases} D(p)e(t) &= (k_m - K_c K_p)N(p)r(t) \\ D(p)y_m(t) &= K_m N(p) r(t) \\ \dot{K_c} &= \eta \frac{K_p}{K_m} y_me \\ \tag{1-15} \end{cases} D(p)e(t)D(p)ym(t)Kc˙=(kmKcKp)N(p)r(t)=KmN(p)r(t)=ηKmKpyme(1-15)

1.5 M I T MIT MIT法则特点

  • 使用的是输出偏差 e e e,而不是状态偏差,所以自适应率所需要的信号都是容易获取的;
  • 设计过程并为考虑稳定性问题,在得到自适应率后需要进行稳定性校验,以保证误差 e e e在闭环回路中能收敛于某一容许值。
  • 对于一阶系统,按照 M I T MIT MIT法则设计的闭环自适应系统总是稳定的,跟踪速度或者自适应速度是按照指数规律进行的,理论上仅当 t → ∞ t \rightarrow \infty t时,误差才趋近为0,所以自适应速度是比较慢的。实际中,并不要求 e e e完全为0,当 ∣ e ∣ ≤ δ |e| \leq \delta eδ时,认为系统就跟踪上参考模型了,在此意义上,自适应调整时间是有限的。
  • 对于高阶系统( n ≥ 2 n \geq 2 n2)需要劳斯判据判断系统的稳定性。

2 L y a p u n o v Lyapunov Lyapunov稳定性理论

李雅普诺夫直接法是一种无须求解系统的动力学方程,就可以直接评估非线性系统平衡点稳定性的强有力工具,该方法是基于机械系统能量的概念提出的。

定义:若函数 V ( x ) V(x) V(x)满足下述条件:

  • V ( x ) V(x) V(x)是正定的,即 V ( x ) > 0 V(x) > 0 V(x)>0并且具有连续的一阶偏导数;

  • V ˙ ( x ) \dot{V}(x) V˙(x)至少是半负定的,即 V ˙ ( x ) = ∂ V ∂ x x ˙ ≤ 0 \dot{V}(x) = \frac{\partial V}{\partial x} \dot{x} \leq 0 V˙(x)=xVx˙0 V ˙ ( x ) ≤ 0 \dot{V}(x) \leq 0 V˙(x)0

那么该函数是一个李雅普诺夫函数。

李雅普诺夫函数是充分非必要的。当李雅普诺夫候选函数不满足稳定条件时,并不一定意味着系统的平衡点是不稳定的,只能说明尚未找到一个合适的李雅普诺夫函数。

3 基于稳定性原理的设计法则

自适应控制通常可以分为两类:直接自适应控制和间接自适应控制。这两类自适应控制也经常结合起来使用,形成复合、组合或者混合直接-间接自适应控制架构。

  • 典型的直接自适应控制器:
    u = k x ( t ) x + k r ( t ) r (3-1) u = k_x(t)x + k_r(t)r \tag{3-1} u=kx(t)x+kr(t)r(3-1)
    其中, k x ( t ) k_x(t) kx(t) k r ( t ) k_r(t) kr(t)是可调控制增益。控制增益的调节机制通过自适应率来实现。直接自适应控制实际上就是直接调节控制系统的反馈机制以抵消任何不想要的系统不确定性,从而可以在控制系统存在显著不确定性的情况下恢复其性能。

  • 间接自适应控制器:
    u = k x ( p ( t ) ) x + k r ( p ( t ) ) r (3-2) u = k_x(p(t))x + k_r(p(t))r \tag{3-2} u=kx(p(t))x+kr(p(t))r(3-2)
    其中, p ( t ) p(t) p(t)是通过在线估计以更新控制增益的系统参数。间接自适应控制器是在线估计不确定参数来调节控制增益的方式来调节系统性能的。

以下介绍一阶单输入单输出系统和二阶单输入单输出系统的直接模型参考自适应控制。

3.1 一阶 S I S O SISO SISO系统

3.1.1 一阶 S I S O SISO SISO系统模型

考虑初始条件为 x ( 0 ) = x 0 x(0)=x_0 x(0)=x0的一阶非线性单输入单输出系统:
x ˙ = a x + b [ u + f ( x ) ] (3-3) \dot{x} = ax + b[u+f(x)] \tag{3-3} x˙=ax+b[u+f(x)](3-3)
其中 f ( x ) f(x) f(x)是结构匹配不确定性,可以表示为线性参数化的形式:
f ( x ) = ∑ i = 1 p θ i ∗ ϕ i ( x ) = Θ ∗ T Φ ( x ) (3-4) f(x) = \sum_{i=1}^{p}{\theta_{i}^{*} \phi_{i}(x)} = {\Theta^{*T}} {\Phi(x)} \tag{3-4} f(x)=i=1pθiϕi(x)=ΘTΦ(x)(3-4)
其中 Θ ∗ = [ θ 1    θ 2    ⋯    θ p ] T ∈ R p \Theta^* = [\theta_1 \,\, \theta_2 \,\, \cdots \,\, \theta_p]^T \in R^p Θ=[θ1θ2θp]TRp是未知常量向量, Φ ( x ) = [ ϕ 1 ( x )    ϕ 2 ( x )    ⋯    ϕ p ( x ) ] T ∈ R p \Phi(x) = [\phi_{1}(x) \,\, \phi_{2}(x) \,\, \cdots \,\, \phi_{p}(x)]^T \in R^p Φ(x)=[ϕ1(x)ϕ2(x)ϕp(x)]TRp是已知的有节基函数。

一阶 S I S O SISO SISO系统的传递函数为:
G ( s ) = Y ( s ) U ( s ) = k τ s + 1 (3-5) G(s) = \frac{Y(s)}{U(s)} = \frac{k}{\tau s + 1} \tag{3-5} G(s)=U(s)Y(s)=τs+1k(3-5)
进行整理:
{ Y ( s ) τ s + Y ( s ) = k U ( s ) y ˙ = − 1 τ y + k τ u (3-6) \begin{cases} Y(s) \tau s + Y(s) = k U(s) \\ \dot{y} = - \frac{1}{\tau} y + \frac{k}{\tau} u \\ \end{cases} \tag{3-6} {Y(s)τs+Y(s)=kU(s)y˙=τ1y+τku(3-6)
x = y ,   a = − 1 τ ,   b = k τ x = y, \, a = -\frac{1}{\tau}, \, b = \frac{k}{\tau} x=y,a=τ1,b=τk,可得:
x ˙ = a x + b u (3-7) \dot{x} = a x + b u \tag{3-7} x˙=ax+bu(3-7)
注意 a a a b b b未知,但 b b b的符号已知。

3.1.2 参考模型

初始条件 x m ( 0 ) = x m 0 x_m(0)=x_{m0} xm(0)=xm0的参考模型:
x m ˙ = a m x m + b m r (3-8) \dot{x_m} = a_m x_m + b_m r \tag{3-8} xm˙=amxm+bmr(3-8)
其中 a m < 0 a_m < 0 am<0 r r r是一个分段连续的有界参考指令,因此 x m x_m xm是一致有界的模型参考信号。

3.1.3 理想控制器

定义一个能够完全抵消不确定性并使得 x ( t ) x(t) x(t)能够跟踪 x m ( t ) x_m(t) xm(t)的理想控制器:
u ∗ = k x ∗ x + k r ∗ r − Θ ∗ T Φ ( x ) (3-9) u^* = k_x^* x + k_r^* r - {\Theta^{*T}} {\Phi(x)} \tag{3-9} u=kxx+krrΘTΦ(x)(3-9)
其中上标“ ∗ ^* ”表示未知的理想常量。

将式(3-9)代入式(3-3)得:
x ˙ = ( a + b k x ∗ ) x + b k r ∗ r (3-10) \dot{x} = (a + b k_x^*)x + b k_r^* r \tag{3-10} x˙=(a+bkx)x+bkrr(3-10)
对比公式(3-10)和(3-8)可得:
{ c c a + b k x ∗ = a m b k r ∗ = b (3-11) \begin{cases}{cc} a + b k_x^* = a_m \\ b k_r ^ * = b \end{cases} \tag{3-11} {cca+bkx=ambkr=b(3-11)

3.1.4 实际控制器

实际自适应控制器为:
u = k x ( t ) x + k r ( t ) r − Θ ∗ T Φ ( x ) (3-12) u = k_x(t) x + k_r(t) r - {\Theta^{*T}} {\Phi(x)} \tag{3-12} u=kx(t)x+kr(t)rΘTΦ(x)(3-12)
其中 k x ( t ) , k r ( t ) , θ ( t ) k_x(t),k_r(t),\theta(t) kx(t),kr(t),θ(t)是对理想增益 k x ∗ , k r ∗ , θ ∗ k_x^*,k_r^*,\theta^* kx,kr,θ的估计值,目标是逼近理想控制器。

3.1.5 闭环跟踪误差模型

估计误差为:
{ k ^ x ( t ) = k x ( t ) − k x ∗ k ^ r ( t ) = k r ( t ) − k r ∗ θ ^ ( t ) = θ ( t ) − θ ∗ (3-13) \begin{cases} \hat{k}_x(t) = k_x(t) - k_x^* \\ \hat{k}_r(t) = k_r(t) - k_r^* \\ \hat{\theta}(t) = \theta(t) - \theta^* \end{cases} \tag{3-13} k^x(t)=kx(t)kxk^r(t)=kr(t)krθ^(t)=θ(t)θ(3-13)
将公式(3-13)代入公式(3-3)可得:
x ˙ = ( a + b k x ∗ + b k ^ x ) x + ( b k r ∗ + b k ^ r ) r − b θ ^ T Φ ( x ) (3-14) \dot{x} = (a + b k_x^* + b \hat{k}_x)x + (b k_r^* + b \hat{k}_r)r - b \hat{\theta}^T \Phi(x) \tag{3-14} x˙=(a+bkx+bk^x)x+(bkr+bk^r)rbθ^TΦ(x)(3-14)
与公式(3-8)做差可得闭环跟踪误差动力学模型为:
e ˙ = x m ˙ − x ˙ = a m e − b k ^ x − b k ^ r + b θ ^ T Φ ( x ) (3-15) \dot{e} = \dot{x_m} - \dot{x} = a_m e - b \hat{k}_x - b \hat{k}_r + b \hat{\theta}^T \Phi(x) \tag{3-15} e˙=xm˙x˙=amebk^xbk^r+bθ^TΦ(x)(3-15)

3.1.6 L y a p u n o v Lyapunov Lyapunov函数

L y a p u n o v Lyapunov Lyapunov函数为:
V ( e , k x ^ , k r ^ , θ ^ ) = e 2 + ∣ b ∣ ( k ^ x 2 γ x + k ^ r 2 γ r + θ ^ T Γ − 1 θ ^ ) > 0 (3-16) V(e,\hat{k_x},\hat{k_r},\hat{\theta}) = e^2 + |b|(\frac{\hat{k}_x^2}{\gamma_x} + \frac{\hat{k}_r^2}{\gamma_r} + \hat{\theta}^T \Gamma^{-1} \hat{\theta}) > 0 \tag{3-16} V(e,kx^,kr^,θ^)=e2+b(γxk^x2+γrk^r2+θ^TΓ1θ^)>0(3-16)
其中, γ x > 0 \gamma_x > 0 γx>0 k x k_x kx的自适应(或者学习)速率, γ r > 0 \gamma_r > 0 γr>0 k r k_r kr的自适应(或者学习)速率, Γ = Γ T > 0 ∈ R p × R p \Gamma = \Gamma ^T > 0 \in R^p \times R^p Γ=ΓT>0Rp×Rp θ ( t ) \theta(t) θ(t)的正定的自适应(或者学习)速率矩阵。
V ˙ = 2 e e ˙ + ∣ b ∣ ( 2 k ^ x k ^ x ˙ γ x + 2 k ^ r k ^ r ˙ γ r + 2 θ ^ T Γ − 1 θ ^ ˙ ) = 2 e ( a m e − b k ^ x − b k ^ r + b θ ^ T Φ ( x ) ) + ∣ b ∣ ( 2 k ^ x k ^ x ˙ γ x + 2 k ^ r k ^ r ˙ γ r + 2 θ ^ T Γ − 1 θ ^ ˙ ) = 2 a m e + 2 k ^ x ( − e b x + ∣ b ∣ k ^ ˙ x γ x ) + 2 k ^ r ( − e b r + ∣ b ∣ k ^ ˙ r γ r ) + 2 θ ^ T ( e b Φ ( x ) + ∣ b ∣ Γ − 1 θ ^ ˙ ) (3-17) \begin{aligned} \dot{V} &= 2 e \dot{e} + |b|(\frac{2 \hat{k}_x \dot{\hat{k}_x}}{\gamma_x} + \frac{2 \hat{k}_r \dot{\hat{k}_r}}{\gamma_r} + 2 \hat{\theta}^T \Gamma^{-1} \dot{\hat{\theta}}) \\ &= 2 e(a_m e - b \hat{k}_x - b \hat{k}_r + b \hat{\theta}^T \Phi(x)) + |b|(\frac{2 \hat{k}_x \dot{\hat{k}_x}}{\gamma_x} + \frac{2 \hat{k}_r \dot{\hat{k}_r}}{\gamma_r} + 2 \hat{\theta}^T \Gamma^{-1} \dot{\hat{\theta}}) \\ &= 2 a_m e + 2 \hat{k}_x (-ebx + |b|\frac{\dot{\hat{k}}_x}{\gamma_x}) + 2 \hat{k}_r (-ebr + |b|\frac{\dot{\hat{k}}_r}{\gamma_r}) + 2 \hat{\theta}^T(eb\Phi(x) + |b|\Gamma^{-1} \dot{\hat{\theta}}) \end{aligned} \tag{3-17} V˙=2ee˙+b(γx2k^xk^x˙+γr2k^rk^r˙+2θ^TΓ1θ^˙)=2e(amebk^xbk^r+bθ^TΦ(x))+b(γx2k^xk^x˙+γr2k^rk^r˙+2θ^TΓ1θ^˙)=2ame+2k^x(ebx+bγxk^˙x)+2k^r(ebr+bγrk^˙r)+2θ^T(ebΦ(x)+bΓ1θ^˙)(3-17)
由于 b = ∣ b ∣ s g n ( b ) , a m < 0 b = |b|sgn(b), a_m < 0 b=bsgn(b),am<0,要满足 V ˙ ≤ 0 \dot{V} \leq 0 V˙0,可令:
{ − e x s g n ( b ) + k ^ ˙ x γ x = 0 − e r s g n ( b ) + k ^ ˙ r γ r = 0 e s g n ( b ) Φ ( x ) + Γ − 1 θ ^ ˙ = 0 (3-18) \begin{cases} -exsgn(b) + \frac{\dot{\hat{k}}_x}{\gamma_x} = 0 \\ -ersgn(b) + \frac{\dot{\hat{k}}_r}{\gamma_r} = 0 \\ esgn(b)\Phi(x) + \Gamma^{-1} \dot{\hat{\theta}} = 0 \end{cases} \tag{3-18} exsgn(b)+γxk^˙x=0ersgn(b)+γrk^˙r=0esgn(b)Φ(x)+Γ1θ^˙=0(3-18)

3.1.7 自适应率

在公式(3-18)中,由于 k x ∗ , k r ∗ , θ ∗ k_x^*,k_r^*,\theta^* kx,kr,θ是常数,因此 k x ∗ ^ ˙ = k ˙ x , k r ∗ ^ ˙ = k ˙ r , θ ^ ˙ = θ ˙ \dot{\hat{k_x^*}} = \dot{k}_x,\dot{\hat{k_r^*}} = \dot{k}_r,\dot{\hat{\theta}} = \dot{\theta} kx^˙=k˙x,kr^˙=k˙r,θ^˙=θ˙。可得自适应律的速率为:
{ k ˙ x = γ x x e s g n ( b ) k ˙ r = γ r r e s g n ( b ) θ ˙ = − Γ Φ ( x ) e s g n ( b ) (3-19) \begin{cases} \dot{k}_x = \gamma_x x e sgn(b) \\ \dot{k}_r = \gamma_r r e sgn(b) \\ \dot{\theta} = -\Gamma \Phi(x) e sgn(b) \\ \end{cases} \tag{3-19} k˙x=γxxesgn(b)k˙r=γrresgn(b)θ˙=ΓΦ(x)esgn(b)(3-19)
可得自适应率为:
{ k ˙ x = k x , 0 + γ x x e s g n ( b ) Δ t k ˙ r = k r , 0 + γ r r e s g n ( b ) Δ t θ ˙ = θ 0 − Γ Φ ( x ) e s g n ( b ) Δ t (3-19) \begin{cases} \dot{k}_x = k_{x,0} + \gamma_x x e sgn(b) \Delta t \\ \dot{k}_r = k_{r,0} + \gamma_r r e sgn(b) \Delta t \\ \dot{\theta} = \theta_0 -\Gamma \Phi(x) e sgn(b) \Delta t \\ \end{cases} \tag{3-19} k˙x=kx,0+γxxesgn(b)Δtk˙r=kr,0+γrresgn(b)Δtθ˙=θ0ΓΦ(x)esgn(b)Δt(3-19)
其中, k x , 0 , k r , 0 , θ 0 k_{x,0}, k_{r,0}, \theta_{0} kx,0,kr,0,θ0为自适应律初始值, Δ t \Delta t Δt为时间步长。

3.2 二阶 S I S O SISO SISO系统

3.2.1 二阶 S I S O SISO SISO系统模型

考虑二阶非线性单输入单输出系统:
y ¨ + 2 ξ ω n y ˙ + ω n 2 y = b [ u + f ( y , y ˙ ) ] (3-20) \ddot{y} + 2 \xi \omega_n \dot{y} + \omega_n^2 y= b[u+f(y, \dot{y})] \tag{3-20} y¨+2ξωny˙+ωn2y=b[u+f(y,y˙)](3-20)
其中 ξ , ω n \xi,\omega_n ξ,ωn是未知参数, f ( y , y ˙ ) f(y,\dot{y}) f(y,y˙)与公式(3-4)类似, f ( y , y ˙ ) = Θ ∗ T Φ ( y , y ˙ ) f(y,\dot{y}) = {\Theta^{*T}} {\Phi(y,\dot{y})} f(y,y˙)=ΘTΦ(y,y˙)

x 1 ( t ) = y ( t ) , x 2 ( t ) = y ˙ ( t ) x_1(t) = y(t),x_2(t)=\dot{y}(t) x1(t)=y(t),x2(t)=y˙(t) x ( t ) = [ x 1 ( t )    x 2 ( t ) ] T x(t)=[x_1(t) \,\, x_2(t)]^T x(t)=[x1(t)x2(t)]T,则系统状态方程为:
x ˙ = A x + B [ u + Θ ∗ Φ ( x ) ] (3-21) \dot{x} = Ax + B[u + {\Theta^*} {\Phi(x)}] \tag{3-21} x˙=Ax+B[u+ΘΦ(x)](3-21)
其中,
A = [ 0 1 − ω n 2 − 2 ξ ω n ] , B = [ 0 b ] (3-22) A = \left[\begin{matrix} 0 & 1 \\ -\omega_n^2 & -2\xi \omega_n \end{matrix} \right], B=\left[\begin{matrix} 0 \\ b \end{matrix} \right] \tag{3-22} A=[0ωn212ξωn],B=[0b](3-22)

3.2.2 参考模型

设参考系统状态空间方程为:
x ˙ m = A m x m + B m r (3-23) \dot{x}_m = A_m x_m + B_m r \tag{3-23} x˙m=Amxm+Bmr(3-23)

3.2.3 理想控制器

u ∗ = K x ∗ x + k r ∗ r − Θ ∗ T Φ ( x ) (3-24) u^* = K_x^* x + k_r^* r - {\Theta^{*T}} {\Phi(x)} \tag{3-24} u=Kxx+krrΘTΦ(x)(3-24)

其中上标“ ∗ ^* ”表示未知的理想常量, K x ∗ ∈ R 2 , k r ∗ ∈ R K_x^* \in R^2, k_r^* \in R KxR2,krR是理想的未知常值增益。

将理想闭环系统和参考模型进行对比,可得匹配条件:
{ A + B K x ∗ = A m B k r ∗ = B m (3-25) \begin{cases} A + B K_x^* = A_m \\ B k_r ^ * = B_m \end{cases} \tag{3-25} {A+BKx=AmBkr=Bm(3-25)

注意:通常,不能总是假设 K x ∗ , k r ∗ K_x^*,k_r^* Kx,kr存在,因为矩阵 A , A m , B , B m A,A_m,B,B_m A,Am,B,Bm可能具有不同的结构,使得 K x ∗ , k r ∗ K_x^*,k_r^* Kx,kr的解不一定存在。在大多是情况下,如果 A , B A,B A,B已知,那么可以通过任意的非自适应控制技术设计 K x ∗ , k r ∗ K_x^*,k_r^* Kx,kr使得闭环系统稳定,并且能够跟踪给定指令。

3.2.4 实际控制器

实际自适应控制器为:
u = K x ( t ) x + k r ( t ) r − Θ ∗ T Φ ( x ) (3-26) u = K_x(t) x + k_r(t) r - {\Theta^{*T}} {\Phi(x)} \tag{3-26} u=Kx(t)x+kr(t)rΘTΦ(x)(3-26)
其中 K x ( t ) , k r ( t ) , θ ( t ) K_x(t),k_r(t),\theta(t) Kx(t),kr(t),θ(t)是对理想增益 K x ∗ , k r ∗ , θ ∗ K_x^*,k_r^*,\theta^* Kx,kr,θ的估计值,目标是逼近理想控制器。

3.2.5 闭环跟踪误差模型

估计误差为:
{ K ^ x ( t ) = K x ( t ) − K x ∗ k ^ r ( t ) = k r ( t ) − k r ∗ θ ^ ( t ) = θ ( t ) − θ ∗ (3-27) \begin{cases} \hat{K}_x(t) = K_x(t) - K_x^* \\ \hat{k}_r(t) = k_r(t) - k_r^* \\ \hat{\theta}(t) = \theta(t) - \theta^* \end{cases} \tag{3-27} K^x(t)=Kx(t)Kxk^r(t)=kr(t)krθ^(t)=θ(t)θ(3-27)
将公式(3-27)代入公式(3-21)可得:
x ˙ = ( A + B K x ∗ + B K ^ x ) x + ( B k r ∗ + B k ^ r ) r − B θ ^ T Φ ( x ) (3-28) \dot{x} = (A + B K_x^* + B \hat{K}_x)x + (B k_r^* + B \hat{k}_r)r - B \hat{\theta}^T \Phi(x) \tag{3-28} x˙=(A+BKx+BK^x)x+(Bkr+Bk^r)rBθ^TΦ(x)(3-28)
与公式(3-23)做差可得闭环跟踪误差动力学模型为:
e ˙ = x m ˙ − x ˙ = A m e − B K ^ x − B k ^ r + B θ ^ T Φ ( x ) (3-29) \dot{e} = \dot{x_m} - \dot{x} = A_m e - B \hat{K}_x - B \hat{k}_r + B \hat{\theta}^T \Phi(x) \tag{3-29} e˙=xm˙x˙=AmeBK^xBk^r+Bθ^TΦ(x)(3-29)

3.2.6 L y a p u n o v Lyapunov Lyapunov函数

L y a p u n o v Lyapunov Lyapunov函数为:
V ( e , K x ^ , k r ^ , θ ^ ) = e ˙ P e + ∣ b ∣ ( K ^ x Γ x − 1 K ^ x T + k ^ r 2 γ r + θ ^ T Γ θ − 1 θ ^ ) > 0 (3-30) V(e,\hat{K_x},\hat{k_r},\hat{\theta}) = \dot{e} P e + |b|(\hat{K}_x \Gamma_x^{-1} \hat{K}_x^T + \frac{\hat{k}_r^2}{\gamma_r} + \hat{\theta}^T \Gamma_{\theta}^{-1} \hat{\theta}) > 0 \tag{3-30} V(e,Kx^,kr^,θ^)=e˙Pe+b(K^xΓx1K^xT+γrk^r2+θ^TΓθ1θ^)>0(3-30)
其中, Γ x = Γ x T > 0 ∈ R 2 × R 2 \Gamma_x = \Gamma_x ^T > 0 \in R^2 \times R^2 Γx=ΓxT>0R2×R2 K x K_x Kx的自适应(或者学习)速率, γ r > 0 \gamma_r > 0 γr>0 k r k_r kr的自适应(或者学习)速率, Γ θ = Γ θ T > 0 ∈ R p × R p \Gamma _{\theta}= \Gamma _{\theta} ^T > 0 \in R^p \times R^p Γθ=ΓθT>0Rp×Rp θ ( t ) \theta(t) θ(t)的正定的自适应(或者学习)速率矩阵, P = P T > 0 ∈ R 2 × R 2 P=P^T > 0 \in R^2 \times R^2 P=PT>0R2×R2是如下李雅普诺夫方程的解:
P A m + A m T P = − Q (3-31) P A_m + A_m^T P = - Q \tag{3-31} PAm+AmTP=Q(3-31)
其中 Q = Q T > 0 ∈ R 2 × R 2 Q=Q^T > 0 \in R^2 \times R^2 Q=QT>0R2×R2
V ˙ = e ˙ T P e + e T P e ˙ + ∣ b ∣ ( 2 K ^ x Γ x − 1 K ^ x T + 2 k ^ r k ^ ˙ r γ r + 2 θ ^ T Γ − 1 θ ^ ˙ ) = e T ( P A m + A m T P ) e + 2 e T P B [ − K ^ x x − k ^ r + θ ^ T Φ ( x ) ] + ∣ b ∣ ( 2 K ^ x Γ x − 1 K ^ x T + 2 k ^ r k ^ ˙ r γ r + 2 θ ^ T Γ − 1 θ ^ ˙ ) (3-32) \begin{aligned} \dot{V} &= \dot{e}^T P e + e^T P \dot{e} + |b|(2 \hat{K}_x \Gamma_x^{-1} \hat{K}_x^T + \frac{2 \hat{k}_r \dot{\hat{k}}_r} {\gamma_r} + 2 \hat{\theta}^T \Gamma^{-1} \dot{\hat{\theta}}) \\ &= e^T(PA_m + A_m^TP)e + 2e^TPB[-\hat{K}_x x - \hat{k}_r + \hat{\theta}^T \Phi(x)] + |b|(2 \hat{K}_x \Gamma_x^{-1} \hat{K}_x^T + \frac{2 \hat{k}_r \dot{\hat{k}}_r}{\gamma_r} + 2 \hat{\theta}^T \Gamma^{-1} \dot{\hat{\theta}}) \end{aligned} \tag{3-32} V˙=e˙TPe+eTPe˙+b(2K^xΓx1K^xT+γr2k^rk^˙r+2θ^TΓ1θ^˙)=eT(PAm+AmTP)e+2eTPB[K^xxk^r+θ^TΦ(x)]+b(2K^xΓx1K^xT+γr2k^rk^˙r+2θ^TΓ1θ^˙)(3-32)
p i j ( i = 1 、 2 , j = 1 、 2 ) p_{ij}(i=1、2,j=1、2) pij(i=12,j=12)是矩阵 P P P的元素,有:
2 e T P B = 2 e T P ˉ b ∈ R (3-33) 2 e^T PB = 2 e^T \bar{P}b \in R \tag{3-33} 2eTPB=2eTPˉbR(3-33)
其中 P ˉ = [ p 12    p 22 ] T \bar{P} = [p_{12} \,\, p_{22}]^T Pˉ=[p12p22]T

可得:
V ˙ = − e T Q e + 2 ∣ b ∣ s g n ( b ) [ − K ^ x x − k ^ r + θ ^ T Φ ( x ) ] e T P ˉ + ∣ b ∣ ( 2 K ^ x Γ x − 1 K ^ x T + 2 k ^ r k ^ ˙ r γ r + 2 θ ^ T Γ − 1 θ ^ ˙ ) = − e T Q e + 2 ∣ b ∣ K ^ x ( − x e T P ˉ s g n ( b ) + Γ x − 1 K ^ ˙ x T ) + 2 ∣ b ∣ k ^ x ( − r e T P ˉ s g n ( b ) + k ^ ˙ r γ r ) + 2 ∣ b ∣ θ ^ T ( Φ ( x ) e T P ˉ s g n ( b ) + Γ θ − 1 Θ ^ ˙ ) (3-34) \begin{aligned} \dot{V} &= -e^T Q e + 2|b|sgn(b)[-\hat{K}_x x - \hat{k}_r + \hat{\theta}^T \Phi(x)]e^T \bar{P} + |b|(2 \hat{K}_x \Gamma_x^{-1} \hat{K}_x^T + \frac{2 \hat{k}_r \dot{\hat{k}}_r}{\gamma_r} + 2 \hat{\theta}^T \Gamma^{-1} \dot{\hat{\theta}}) \\ &= -e^T Q e + 2|b|\hat{K}_x (-xe^T\bar{P}sgn(b) + \Gamma_x^{-1}\dot{\hat{K}}_x^T) + 2|b|\hat{k}_x (-re^T\bar{P}sgn(b) + \frac{\dot{\hat{k}}_r}{\gamma_r}) + 2|b|\hat{\theta}^T (\Phi(x)e^T\bar{P}sgn(b) + \Gamma_{\theta}^{-1}\dot{\hat{\Theta}}) \end{aligned} \tag{3-34} V˙=eTQe+2∣bsgn(b)[K^xxk^r+θ^TΦ(x)]eTPˉ+b(2K^xΓx1K^xT+γr2k^rk^˙r+2θ^TΓ1θ^˙)=eTQe+2∣bK^x(xeTPˉsgn(b)+Γx1K^˙xT)+2∣bk^x(reTPˉsgn(b)+γrk^˙r)+2∣bθ^T(Φ(x)eTPˉsgn(b)+Γθ1Θ^˙)(3-34)

3.2.7 自适应率

可得自适应律的速率为:
{ K ˙ x = Γ x x e T P ˉ s g n ( b ) k ˙ r = Γ r r e T P ˉ s g n ( b ) θ ˙ = − Γ Θ Φ ( x ) e T P ˉ s g n ( b ) (3-35) \begin{cases} \dot{K}_x = \Gamma_x x e^T \bar{P} sgn(b) \\ \dot{k}_r = \Gamma_r r e^T \bar{P} sgn(b) \\ \dot{\theta} = -\Gamma_{\Theta} \Phi(x) e^T \bar{P} sgn(b) \\ \end{cases} \tag{3-35} K˙x=ΓxxeTPˉsgn(b)k˙r=ΓrreTPˉsgn(b)θ˙=ΓΘΦ(x)eTPˉsgn(b)(3-35)

4 Reference :

1 自适应控制—模型参考自适应控制 基于局部参数最优化的设计方法

[2] 模型参考自适应控制导论[M].

  • 46
    点赞
  • 136
    收藏
    觉得还不错? 一键收藏
  • 8
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值