学习随笔#12 最优化控制(Optimal Control)

最优化控制是寻求在约束条件下使系统性能最优的方法。在单输入单输出(SISO)系统中,通过最小化误差平方积分和输入信号平方积分的代价函数来优化跟踪性能和输入大小。对于多输入多输出(MIMO)系统,代价函数更为复杂,涉及状态方程和权重系数的调节。优化此函数可以得到最优输入信号,实现系统性能的最大提升。
摘要由CSDN通过智能技术生成

最优化控制(Optimal Control)

  在约束条件下达到最优的系统表现。下图是一个单输入单输出(SISO)系统的控制系统框图。
SISO系统框图
  在这个系统中,我们定义误差 e ( t ) e(t) e(t)为参考信号 r ( t ) r(t) r(t)与输出信号 y ( t ) y(t) y(t)的差,即 e ( t ) = y ( t ) − r ( t ) e(t)=y(t)-r(t) e(t)=y(t)r(t)。如果我们使得 ∫ 0 t e 2 d t \int^t_0e^2\mathrm{d}t 0te2dt越小,则系统的跟踪性能越好;如果使得 ∫ 0 t u 2 d t \int_0^tu^2\mathrm{d}t 0tu2dt越小,则系统的输入越小,因此我们就有了若干优化指标。
  如果分别调整这些优化指标,需要进行大量的调整和测试才能得到最优结果,但如果能把这些指标统一到一个式子中,那么我们只要求解这个式子就可以得到最优结果,因此我们提出了代价函数(Cost Function)的概念。
J = ∫ 0 t ( q e 2 + r u 2 ) d t J=\int^t_0(qe^2+ru^2)\mathrm{d}t J=0t(qe2+ru2)dt
  通过求解代价函数的最小值,我们就可以得到最优的输入信号。方程中的 q q q r r r是两个因数,若 q ≪ r q\ll r qr,说明我们更重视误差 e e e对结果的影响;若 q ≫ r q\gg r qr,说明我们更重视输入 u u u对结果的影响。
  对于多输入多输出(MIMO)系统来说,设其状态方程为
{ d x d t = A x + B u Y = C x \begin{cases} \displaystyle\frac{\mathrm{d}x}{\mathrm{d}t}=Ax+Bu\\Y=Cx \end{cases} dtdx=Ax+BuY=Cx
则其代价函数为
J = ∫ 0 t ( E T Q E + U T R U ) d t J=\int^t_0(E^TQE+U^TRU)\mathrm{d}t J=0t(ETQE+UTRU)dt
其中
E = Y − R = [ y 1 − r 1 y 2 − r 2 ] = [ x 1 x 2 ] E=Y-R=\left[\begin{matrix}y_1-r_1\\y_2-r_2\end{matrix}\right]=\left[\begin{matrix}x_1\\x_2\end{matrix}\right] E=YR=[y1r1y2r2]=[x1x2]
注意此处 R R R为参考矩阵,与上下文的调节矩阵不同。
所以
{ E T Q E = q 1 x 1 2 + q 2 x 2 2 U T R U = r 1 u 1 2 + r 2 u 2 2 \begin{cases} E^TQE=q_1x_1^2+q_2x_2^2\\U^TRU=r_1u_1^2+r_2u_2^2 \end{cases} {ETQE=q1x12+q2x22UTRU=r1u12+r2u22
其中 Q Q Q R R R为调节矩阵, q 1 q_1 q1 q 2 q_2 q2 r 1 r_1 r1 r 2 r_2 r2为权重系数。以上就是最优化控制的思路。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值