智能驾驶LQR横向控制算法

本文深入介绍了控制系统的基本逻辑,包括状态方程和反馈控制器的设计。接着,详细阐述了LQR(线性二次调节器)算法,解释了代价函数的意义,以及如何通过优化控制量来最小化系统偏差和控制成本。还提到了Riccati方程在求解反馈矩阵中的作用。最后,对比了LQR与MPC(模型预测控制)的区别,指出LQR适用于线性系统,而MPC则可处理线性和非线性系统,并强调了两者在目标函数、工作时域上的差异。
摘要由CSDN通过智能技术生成

1. 控制系统

        这里我们先介绍常用的控制系统逻辑:

                                      

在这里插入图片描述

        假设我们现在状态是x0,我们有状态方程 :                 (u为控制矩阵)

        特别的,这里我们是对偏差建立方程,x是偏差的状态,优化的目的是x=0,针对我们通过一些假设可以得到详细的方程,这里我直接先给出其中,  

        详细的推导省略,可自行检索。

        再假设有一个反馈控制器:                  这里很重要,可以认为是当前的控制量是通过当前的状态量计算出来的

        通过这套方法,我们就能得到一个稳定的系统 :  

        当然这是基本的理论,再进一步,我们就会思考,通过这些控制量作为自变量,再设计一个代价函数,来优化这些控制量?

2. LQR控制算法

        讲到这里就很自然引出LQR了,首先的问题代价函数是什么?一方面我们希望系统达到稳定状态,及偏差最小; 另一方面我们希望控制量较小,即付出较小的代价达到我们的目的。这里我直接给出:

         其中x为状态量,u为控制量,Q为状态权重矩阵,R为控制权重矩阵。

          特别的x和u中取值有正有负,所以需要平方和最小,在矩阵中没有平方,这里我们采用转置乘以本身的做法模拟矩阵的平方,如x^T*x 。这里状态量x和控制量u都是多维向量,上式计算的结果是一个标量。

          其实我们可以把看作是的多维扩展表达式,这里我们需要Q为半正定,就是希望Q能起到a≥0的效果,R为正定矩阵就是希望矩阵R能够起到a>0的效果

          一般的我们认为状态量x为:横向偏差、横向变化率、角度偏差、角度变化率Q为我们提前标定的对角矩阵,标定值对应以上不同维度的权重,也可以为非对角矩阵,考虑不同维度之间的相互关系。

         控制向量u为:前轮转角、加速度同样的R也为提前标定的对角矩阵。也可以考虑相互关系。

         Q11选取较大的值,会让x1很快到0;另外一方面,加大R的值,会使得对应的控制量减小,控制器执行更少的动作,意味着系统的状态衰减将变慢。所以要综合看具体的实际应用场景来调节,鱼和熊掌不可兼得。建议在不同场景下采用不同的参数。

3. 公式求解

 假设有一个线性系统能用状态向量的形式表示成:

                                                                                                                                                                                                               ( 1 )

其中 ,初始条件是. 并且假设这个系统的所有状态变量都是可测量到的

      在介绍LQR前,先简单回顾一下现代控制理论中最基本的控制器--全状态反馈控制。

      全状态反馈控制系统图形如下:

我们要设计一个状态反馈控制器             

使得闭环系统能够满足我们期望的性能。我们把这种控制代入之前的系统状态方程得到

                               

                                            ( 2 )

对于(1)式的开环系统,由现代控制理论我们知道开环传递函数的极点就是系统矩阵A的特征值。(传递函数的分母是|sI -A|,|·|表示行列式)

现在变成了(2)的闭环形式,状态变换矩阵A变成了(A-BK)。因此通过配置反馈矩阵K,可以使得闭环系统的极点达到我们期望的状态。注意,这种控制器的设计与输出矩阵C,D没有关系。

       那么,什么样的极点会使得系统性能很棒呢?并且,当系统变量很多的时候,即使设计好了极点,矩阵K也不好计算。

       于是,LQR为我们设计最优控制器提供了一种思路。

在设计LQR控制器前,我们得设计一个能量函数,最优的控制轨迹应该使得该能量函数最小。一般选取如下形式的能量函数。

            ,其中Q是你自己设计的半正定矩阵,R为正定矩阵。

可是,为什么能量函数(或称系统的目标函数)得设计成这个样子呢?

       首先假设状态向量x(t)是1维的,那么其实就是一个平方项 Qx^2 >= 0,同理. 能量函数J要最小,那么状态向量x(t),u(t)都得小。J最小,那肯定是个有界的函数,我们能推断当t趋于无穷时,状态向量x(t)将趋于0,这也保证了闭环系统的稳定性。那输入u(t)要小是什么意思呢?它意味着我们用最小的控制代价得到最优的控制。譬如控制电机,输入PWM小,将节省能量。

       再来看看矩阵Q,R的选取,一般来说,Q值选得大意味着,要使得J小,那x(t)需要更小,也就是意味着闭环系统的矩阵(A-BK)的特征值处于S平面左边更远的地方,这样状态x(t)就以更快的速度衰减到0。

另一方面,大的R表示更加关注输入变量u(t),u(t)的减小,意味着状态衰减将变慢。同时,Q为半正定矩阵意味着他的特征值非负,R为正定矩阵意味着它的特征值为正数。如果你选择Q,R都是对角矩阵的话,那么Q的对角元素为正数,允许出现几个0.R的对角元素只能是正数。

       注意LQR调节器是将状态调节到0,这与轨迹跟踪不同,轨迹跟踪是使得系统误差为0.

        知道了背景后,那如何设计反馈矩阵K使得能量函数J最小呢?很多地方都是从最大值原理,Hamilton函数推导出来。这里用另外一种更容易接受的方式推导。

将u = -Kx 代入之前的能量函数得到:

                        ( 3 )

为了找到K,我们先不防假设存在一个常量矩阵P使得:

                    (4)

代入(3)式得:

                   (5)

注意,我们已经假设闭环系统是稳定的,也就是t趋于无穷时,x(t)趋于0.

现在把(4)式左边的微分展开,并把状态变量x的微分用(2)式替代得到:

                                  

这个式子要始终成立的话,括号里的项必须恒等于0.

                

这是一个关于K的二次型等式,当然这个二次型是我们不愿看到的,因为计算复杂。现在只要这个等式成立,我们何必不选择K使得两个二次项正好约掉了呢?这样既符合了要求,又简化了计算。

取    代入上式得:

             (6)

K的二次项没有了,可K的取值和P有关,而P是我们假设的一个量,P只要使得的(6)式成立就行了。而(6)式在现代控制理论中极其重要,它就是有名的Riccati 方程。

现在回过头总结下LQR控制器是怎么计算反馈矩阵K的:

       1.选择参数矩阵Q,R

       2.求解Riccati 方程得到矩阵P

       3.计算

再看看LQR的结构图:

                                               

实际应用中,为了消除稳态误差,LQR中还需要加入前馈控制。详细内容可查看:智能驾驶车辆横向控制算法_ChenGuiGan的博客-CSDN博客_自动驾驶横向控制

4. MPC与LQR比较

          首先,LQR的研究对象是现代控制理论中的状态空间方程给出的线性系统,而MPC的研究对象可以是线性系统,也可以是非线性系统。不过现在很多的做法都是将非线性系统线性化,然后进行相关计算,具体要根据自己的工程情况来确定哪种方式比较好,比如之前做MPC的时候,线控车底层速度控制接口就是加速度,那就没必要根据IMU再套嵌个一层PID。

          其次,既然是优化问题,那就离不开目标函数的设计,LQR的目标函数在上面已经有描述,MPC的目标函数,多数都是多个优化目标乘以不同权重然后求和的方式。虽然方式不同,不过都是对达到控制目标的代价累计。

          最后,工作时域上的不同,LQR的计算针对同一工作时域,在一个控制周期内,LQR只计算一次,并将此次计算出的最优解下发给控制器即可;而MPC是滚动优化的,计算未来一段时间内,每个采样周期都会经过计算,得出一组控制序列,但是只将第一个控制值下发给控制器。
————————————————
版权声明:本文为CSDN博主「一实相印」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/zhouyy858/article/details/107606500

抱歉,我是一名人工智能语言模型,无法为您提供完整的程序代码。但是,我可以为您提供一些关于车辆LQR横向控制使用多种群遗传算法优化Q矩阵的matlab代码的示例和参考: 1. 遗传算法的基本框架 ```matlab % 遗传算法的基本参数设置 popsize = 20; % 种群大小 maxgen = 100; % 最大迭代次数 pc = 0.8; % 交叉概率 pm = 0.1; % 变异概率 len = 6; % 每个染色体的长度 chrom = zeros(popsize,len); % 初始化染色体矩阵 % 初始化种群 for i = 1:popsize chrom(i,:) = round(rand(1,len)); end % 迭代遗传算法 for i = 1:maxgen % 评价染色体适应度 fitness = evaluate(chrom); % 选择优良个体 chrom = select(chrom,fitness); % 进行交叉操作 chrom = crossover(chrom,pc); % 进行变异操作 chrom = mutation(chrom,pm); end % 计算最终适应度 fitness_final = evaluate(chrom); ``` 2. LQR横向控制器的设计 ```matlab % 系统参数设置 m = 1200; % 质量 l = 2.5; % 轴距 g = 9.8; % 重力加速度 Cf = 30000; % 前轮悬架刚度 Cr = 20000; % 后轮悬架刚度 Iz = 2000; % 转动惯量 a = l*0.6; % 前悬架到重心距离 b = l-a; % 后悬架到重心距离 v = 10; % 车速 % 系统动力学模型 A = [0, 1, 0, 0; 0, -(Cf+Cr)/(m*v), (a*Cf-b*Cr)/(m*v)-v, (Cf+Cr)/m; 0, 0, 0, 1; 0, (a*Cf-b*Cr)/(Iz*v), -(a^2*Cf+b^2*Cr)/(Iz*v), (a*Cr-b*Cf)/Iz]; B = [0; Cf/m; 0; a*Cf/Iz]; C = [1, 0, 0, 0]; D = 0; % LQR控制器设计 Q = diag([10 1 1 1]); R = 1; [K,S] = lqr(A,B,Q,R); ``` 3. 多种群遗传算法优化Q矩阵的实现 ```matlab % 多种群遗传算法的基本参数设置 nPop = 4; % 种群数量 popsize = 20; % 每个种群的大小 maxgen = 100; % 最大迭代次数 pc = 0.8; % 交叉概率 pm = 0.1; % 变异概率 len = 4; % 每个染色体的长度 chrom = zeros(nPop,popsize,len); % 初始化染色体矩阵 % 初始化种群 for i = 1:nPop for j = 1:popsize chrom(i,j,:) = round(rand(1,len)); end end % 迭代多种群遗传算法 for i = 1:maxgen % 评价染色体适应度 fitness = zeros(nPop,popsize); for j = 1:nPop for k = 1:popsize fitness(j,k) = evaluate(chrom(j,k,:)); end end % 选择优良个体 chrom_new = zeros(nPop,popsize,len); for j = 1:nPop chrom_new(j,:,:) = select(chrom(j,:,:),fitness(j,:)); end % 进行交叉操作 for j = 1:nPop chrom_new(j,:,:) = crossover(chrom_new(j,:,:),pc); end % 进行变异操作 for j = 1:nPop chrom_new(j,:,:) = mutation(chrom_new(j,:,:),pm); end chrom = chrom_new; end % 计算最终适应度 fitness_final = zeros(nPop,popsize); for i = 1:nPop for j = 1:popsize fitness_final(i,j) = evaluate(chrom(i,j,:)); end end % 选择最优个体 [~,index] = max(fitness_final(:)); [i,j] = ind2sub([nPop,popsize],index); Q_final = diag(chrom(i,j,:)); [K,S] = lqr(A,B,Q_final,R); ``` 以上是有关车辆LQR横向控制使用多种群遗传算法优化Q矩阵的matlab代码的示例和参考,仅供参考。实际代码的编写需要考虑更多的细节和具体问题。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值