用庞特里亚金极小值原理求解二阶系统的最优控制问题

本文介绍庞特里亚金极小值原理,一种解决最优控制问题的方法,适用于控制向量受限的情况。文章详细解释了原理,并通过一个二阶系统实例,展示了如何求解最优控制和状态。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

庞特里亚金极小值原理
1
庞特里亚金极小值原理是在控制向量u(t)受限制的情况下,使得目标函数J取极小,从而求解最优控制问题的原理和方法,又称极大值原理。λ是协态向量,系统模型有多少个变量就有多少个协态。s和u都是省略了符号t的,代表某一时刻的最优状态和最优控制,是一个常数。利用庞特里亚金极小值原理求解最优控制问题首先需要求解协态方程,也就是λ,然后再求解最优控制u*,求解完u*之后,即可得到最优状态。
下面以一个简单的二阶系统为例,简单说明如何用庞特里亚金极小值原理求解二阶系统的最优控制问题。

1. 问题描述

二阶系统的状态s为: s = [ x x ˙ ] s = \left[ \begin{array} { l } { x } \\ { \dot { x } } \end{array} \right] s=[xx˙],控制量u为: u = [ x ¨ ] u = [ \ddot { x } ] u=[x¨],可以将状态s想象成x方向的位移以及x方向上的速度,将控制量u想象成x方向上的加速度,通过输入控制量来改变系统的状态。将问题定义为:试求控制u,将系统在t=2时转移到零态,并使得J取极小值。

系统模型为:
s ˙ = [ 0 1 0 0 ] s + [ 0 1 ] u = [ 0 1 0 0 ] [ x x ˙ ] + [ 0 1 ] x ¨ \begin{aligned} \dot { s } & = \left[ \begin{array} { l l } { 0 } & { 1 } \\ { 0 } & { 0 } \end{array} \right] s + \left[ \begin{array} { l } { 0 } \\ { 1 } \end{array} \right] u = \left[ \begin{array} { l l } { 0 } & { 1 } \\ { 0 } & { 0 } \end{array} \right] \left[ \begin{array} { l } { x } \\ \dot { x } \end{array} \right] + \left[ \begin{array} { l } { 0 } \\ { 1 } \end{array} \right] \ddot { x } \end{aligned} s˙=[0010]s+[01]u=[0010][xx˙]+[01]x¨
目标函数为:
J = 1 2 ∫ 0 2 u 2 d t J = \frac { 1 } { 2 } \int _ { 0 } ^ { 2 } u ^ { 2 } d t J=2102u2dt

2. 求解协态方程

根据庞特里亚金极小值原理中的:
λ ˙ ( t ) = − ∇ s H ( s ∗ ( t ) , u ∗ ( t ) , λ ( t ) ) \dot { \lambda } ( t ) = - \nabla _ { s } H \left( s ^ { * } ( t ) , u ^ { * } ( t ) , \lambda ( t ) \right) λ˙(t)=sH(s(t),u(t),λ(t))
先写出哈密顿函数,然后根据哈密顿函数列出协态方程,并求解。
哈密顿函数为:
H = 1 2 u 2 + λ 1 s 2 + λ 2 u H = \frac { 1 } { 2 } u ^ { 2 } + \lambda _ { 1 } s_ { 2 } + \lambda _ { 2 } u H=21u2+λ1s2+λ2u
两个λ分别乘上对应的系统模型 s ˙ \dot { s } s˙中的两个元素s2和u,其中s2就代表s的第二行的元素(同时也是 s ˙ \dot { s } s˙中第一行的元素),也就是x方向的速度。u即为控制量(同时也是 s ˙ \dot { s } s˙中第二行的元素),这样就得到了哈密顿函数。
将哈密顿函数分别对s1和s2(状态矩阵 s {s} s中的元素)求导,并将s和u这两个常量代入可得协态方程:
λ ˙ 1 ( t ) = − ∂ H ∂ s 1 = 0 ⇒ λ 1 ( t ) = a 1 \dot { \lambda } _ { 1 } ( t ) = - \frac { \partial H } { \partial s _ { 1 } } = 0 \quad \Rightarrow \lambda _ { 1 } ( t ) = a _ { 1 } λ˙1(t)=s1H=0λ1(t)=a1

λ ˙ 2 ( t ) = − ∂ H ∂ s 2 = − λ 1 ( t ) ⇒ λ 2 ( t ) = − a 1 t + a 2 \dot { \lambda } _ { 2 } ( t ) = - \frac { \partial H } { \partial s _ { 2 } } = - \lambda _ { 1 } ( t ) \Rightarrow \lambda _ { 2 } ( t ) = - a _ { 1 } t + a _ { 2 } λ˙2(t)=s2H=λ1(t)λ2(t)=a1t+a2
通过求解上述的微分方程即可求得λ。

3. 求解最优控制

根据庞特里亚金极小值原理中的:
u ∗ ( t ) = arg ⁡ min ⁡ u ( t ) H ( s ∗ ( t ) , u ( t ) , λ ( t ) ) u ^ { * } ( t ) = \arg \min _ { u ( t ) } H \left( s ^ { * } ( t ) , u ( t ) , \lambda ( t ) \right) u(t)=argu(t)minH(s(t),u(t),λ(t))

最优的u*的选取是,当哈密顿函数中的s取最优时,能够使得哈密顿函数最小的那个u即为最优控制量。令导数等于0即可:
∂ H ∂ u = u + λ 2 = 0 ⇒ u = − λ 2 = a 1 t − a 2 \frac { \partial H } { \partial u } = u + \lambda _ { 2 } = 0 \quad \Rightarrow u = - \lambda _ { 2 } = a _ { 1 } t - a _ { 2 } uH=u+λ2=0u=λ2=a1ta2
求得u的表达式之后,对u进行两次积分可以得到s1和s2(状态矩阵 s {s} s中的元素):
s 1 = 1 6 a 1 t 3 − 1 2 a 2 t 2 + a 3 t + a 4 s 2 = 1 2 a 1 t 2 − a 2 t + a 3 \begin{array} { l } {s _ { 1 } = \frac { 1 } { 6 } a _ { 1 } t ^ { 3 } - \frac { 1 } { 2 } a _ { 2 } t ^ { 2 } + a _ { 3 } t + a _ { 4 } } \\ { s _ { 2 } = \frac { 1 } { 2 } a _ { 1 } t ^ { 2 } - a _ { 2 } t + a _ { 3 } } \end{array} s1=61a1t321a2t2+a3t+a4s2=21a1t2a2t+a3

将初始条件和终端条件代入可求得:
u ∗ ( t ) = 9 2 t − 5 u ^ { * } ( t ) = \frac { 9 } { 2 } t - 5 u(t)=29t5

评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值