笔记92:连续状态空间方程转化为离散状态空间方程的详细推导 + 离散LQR控制器详细推导

1)离散LQR的推导原理:


拉格朗日乘子法都是在等式约束下用的;

对这个性能函数J运用拉格朗日乘子法后,得到的函数是二次型函数(即转化为了最优化控制问题)二次型函数只有一个极值点而且是极小值点,那么极小值就是最小值;

使用Frenet坐标系中的车辆动力学方程作为约束条件;


a

a

a

a

a

a

2)离散状态空间方程推导:


注:这里的推导省略了一个求逆的运算,因为dt就是采样周期,而采样周期一般取值很小所以这里可以忽略不计,减少计算量;


a

a

a

a

a

a

3)DLQR的求解方程推导:


注:本质上是求U_{k}的值使得性能函数J取得最小值;

解释:因为X_{k+1}中的所有的值都是受U_{k}决定的,因为本来X_{k+1}U_{k}的值是存在一个关系,这个关系由离散动力学方程描述出来,所以当指定了U_{k}的值的时候,该动力学方程就成为了一个确定的微分方程了,求解这个微分方程就可以将X_{k+1}求解出来,所以真正的未知数只有U_{k}一个(X_{k}是已知初始条件),所以用拉格朗日乘子法求J的最小值本质上就是求一系列适合的U_{k}的值,使得代价函数J的值最小;

得到新的性能函数J:加入了拉格朗日乘子之后

得到性能函数的偏导数:

最终得到:

求解\lambda _{k}的递推式:

为什么要求\lambda _{k}的递推式:是因为由2式知要想求U_{k},则必须要先知道\lambda _{k+1}求出U_{k}以后LQR问题就解决了;

将求\lambda _{k}的递推式改为求P_{k}的递推式:

里卡提(Riccati)方程(一个迭代公式)有一个很好的性质:


a

a

a

a

a

a

4)DLQR算法总结:


a

对LQR算法本质的总结:

  • 利用性能函数J作为目标;
  • 利用Frenet上的动力学方程作为(等式)约束条件;
  • 使用拉格朗日乘子法计算J的极小值点处U的值在这一步中经过数学推导,可以不用计算复杂的拉格朗日乘子法,直接用现成的里卡提公式就可以计算出极小值点处U的值)

  • 5
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
离散LQR(线性二次调节)控制器是一种广泛应用于控制系统的优化控制方法。它通过在系统状态空间中定义一个成本函数,并最小化这个成本函数来设计控制器,以实现系统的性能优化。 离散LQR控制器的设计过程包含以下几个步骤: 1. 系统建模:首先,需要根据实际的控制系统确定系统的数学模型,并将其转换为状态空间表示。一般来说,这个模型可以使用差分方程或差分方程组来描述。 2. 定义成本函数:然后,需要定义一个成本函数,用来评估系统的性能。成本函数可以包括系统状态、控制输入或者其他相关指标。一般来说,成本函数是由系统性能指标和权重矩阵构成的二次型函数。 3. 计算最优控制器:通过解决离散时不变的Riccati方程,可以得到最优的状态反馈增益矩阵。这个增益矩阵可以将系统状态与控制输入相联系,以实现对系统的最优控制。 4. 性能评估:通过模拟系统的行为,可以评估控制器的性能。这可以通过计算成本函数的值来实现,从而比较不同控制器的优劣。 离散LQR控制器的优点是:它能够优化系统的性能,使得系统的稳定性、响应速度和鲁棒性都能得到改善。此外,离散LQR控制器的设计方法相对简单,容易实现和调整。 然而,离散LQR控制器也存在一些限制。首先,它要求系统的模型是线性的,并且能够被准确地表示为状态空间方程。其次,离散LQR控制器也对系统的测量精度和噪声等因素比较敏感。 总之,离散LQR控制器是一种基于状态反馈的优化控制方法,适用于线性离散系统。它可以通过最小化成本函数,设计出最优的控制器,从而提高系统的性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值