HJI与HJB

问题描述

设连续系统状态方程和性能指标
X ˙ = f ( t , X , U ) X ( t 0 ) = X 0 J = ϕ [ X ( t f ) , t f ] + ∫ t 0 t f F ( X , U , t ) d t \begin{aligned} \dot{X} & =f(t, X, U) \quad X\left(t_{0}\right)=X_{0} \\ J & =\phi\left[X\left(t_{f}\right), t_{f}\right]+\int_{t_{0}}^{t_{f}} F(X, U, t) d t \end{aligned} X˙J=f(t,X,U)X(t0)=X0=ϕ[X(tf),tf]+t0tfF(X,U,t)dt

HJI与HJB方程

HJB方程

设定如下哈密顿函数定义:
H ( X , U , λ , t ) = F ( X , U , t ) + λ T f ( X , U , t ) λ = ∂ V ∂ X \begin{aligned} H(X, U, \lambda, t)=&F(X, U, t)+\lambda^{T} f(X, U, t) \\ \lambda=&\frac{\partial V}{\partial X} \end{aligned} H(X,U,λ,t)=λ=F(X,U,t)+λTf(X,U,t)XV
HJB方程
− ∂ V ∂ t = min ⁡ u ∈ Ω H ( X , U , ∂ V ∂ X , t ) = H ∗ ( X , U , ∂ V ∂ X , t ) -\frac{\partial V}{\partial t}=\min _{u \in \Omega} H\left(X, U, \frac{\partial V}{\partial X}, t\right)=H^{*}\left(X, U, \frac{\partial V}{\partial X}, t\right) tV=uΩminH(X,U,XV,t)=H(X,U,XV,t)
此外,参数 λ \lambda λ满足协态方程
λ ˙ = − ∂ H ∂ X \dot{\lambda}=-\frac{\partial H}{\partial X} λ˙=XH
横截条件
λ ( t f ) = ∂ ϕ ∂ X ( t f ) \lambda(t_f)=\frac{\partial \phi}{\partial X(t_f)} λ(tf)=X(tf)ϕ

HJI方程

考虑一个博弈问题其价值函数为
V ( x ) = min ⁡ u p max ⁡ u e J V(\boldsymbol{x})=\min _{\boldsymbol{u}_{p}} \max _{\boldsymbol{u}_{e}} J V(x)=upminuemaxJ
HJI方程
− ∂ V ∂ t = ∂ V ∂ x f ( x ) + F ( x ) -\frac{\partial V}{\partial t}=\frac{\partial V}{\partial \boldsymbol{x}}f(x)+F(x) tV=xVf(x)+F(x)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值