- 博客(14)
- 收藏
- 关注
原创 封装Gym---搭建强化学习环境
OpenAI Gym是一个用于开发和比较强化学习算法的工具包。OpenAI Gym提供了一个模拟环境,能够在这个环境中测试和评估强化学习算法。
2024-02-29 20:11:01 1691 1
原创 强化学习(1)---马尔可夫决策过程MDP基本概念以及求解价值函数
强化学习是什么,强化学习的基本过程MP、MRP以及最重要的MDP,求解每个过程的价值函数。最优策略使期望回报的最大化,得到最优的状态价值函数,完成强化学习的目标。
2023-11-30 15:27:47 1263 1
原创 numpy中的identity()、eye()与concatenate()
numpy.identity(n, dtype = None):返回一个n阶的二维单位方阵(即主对角线元素均为1)。n:int型,代表返回的矩阵的行数和列数都是n。dtype:数组元素的类型,默认为float64。
2023-11-22 16:10:07 199 1
原创 MPC---模型预测控制设计及基于CARLA的Python代码实现
理解MPC的概念与设计思路,构建MPC对应的二次规划的代价函数形式(系统状态变量的初始状态是已知的,只与控制有关)。然后求解使得代价函数J最小的控制,取向量的k时刻预测的u就是使得误差渐渐趋于0的最优控制。
2023-11-14 21:59:39 1218 3
原创 最优控制问题
总结:最优控制问题就是先将问题给数学化,通过问题来得到系统的状态空间方程,然后设计控制器(这个控制器就可以用LQR或者MPC)能够得到通过输入误差(系统的变量与目标变量的差)来得到控制量u,得到的控制量u能够使设计的代价函数J最小。
2023-11-09 21:09:38 123 1
原创 自动驾驶控制算法---横向控制(MPC/LQR)和纵向控制(PID算法及基于CARLA的Python代码实现)
基于规划的的轨迹,连接相应的横向控制与纵向控制接口即完成控制的目的。实现PID纵向速度控制,完成代码编写。
2023-11-07 17:40:57 2271 6
原创 自动驾驶控制算法---离散规划轨迹的误差
通过离散的规划点来近似计算出投影点的信息,然后代入误差的计算公式得到的值,代入控制公式算出使误差趋于0的控制量。
2023-11-03 21:36:25 82
原创 自动驾驶控制算法---求解误差微分方程(LQR算法及基于CARLA的Python代码实现)
使用LQR算出反馈控制的k值,然后利用k去算出前馈控制,此时施加控制u就满足误差稳态是0的控制要求了。
2023-11-01 21:25:02 989
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人