Be No.1-CSDN博客

原创封装Gym---搭建强化学习环境

OpenAI Gym是一个用于开发和比较强化学习算法的工具包。OpenAI Gym提供了一个模拟环境，能够在这个环境中测试和评估强化学习算法。

2024-02-29 20:11:01 1691 1

原创强化学习（3）--- 基于策略函数的强化学习算法

基于策略函数的强化学习算法

2024-01-03 21:12:01 702 2

原创强化学习（2）--- 基于价值函数的强化学习算法

基于价值函数的强化学习算法

2023-12-18 15:45:26 849 5

原创强化学习（1）---马尔可夫决策过程MDP基本概念以及求解价值函数

强化学习是什么，强化学习的基本过程MP、MRP以及最重要的MDP，求解每个过程的价值函数。最优策略使期望回报的最大化，得到最优的状态价值函数，完成强化学习的目标。

2023-11-30 15:27:47 1263 1

原创 numpy中的identity()、eye()与concatenate()

numpy.identity(n, dtype = None)：返回一个n阶的二维单位方阵（即主对角线元素均为1）。n：int型，代表返回的矩阵的行数和列数都是n。dtype：数组元素的类型，默认为float64。

2023-11-22 16:10:07 199 1

原创 python中的“＠”与“＊”运算符

运算符是对矩阵进行来用的。

2023-11-21 22:09:19 1440

原创 MPC---模型预测控制设计及基于CARLA的Python代码实现

理解MPC的概念与设计思路，构建MPC对应的二次规划的代价函数形式（系统状态变量的初始状态是已知的，只与控制有关）。然后求解使得代价函数J最小的控制，取向量的k时刻预测的u就是使得误差渐渐趋于0的最优控制。

2023-11-14 21:59:39 1218 3

原创最优控制问题

总结：最优控制问题就是先将问题给数学化，通过问题来得到系统的状态空间方程，然后设计控制器（这个控制器就可以用LQR或者MPC）能够得到通过输入误差（系统的变量与目标变量的差）来得到控制量u，得到的控制量u能够使设计的代价函数J最小。

2023-11-09 21:09:38 123 1

原创自动驾驶控制算法---横向控制（MPC/LQR）和纵向控制（PID算法及基于CARLA的Python代码实现）

基于规划的的轨迹，连接相应的横向控制与纵向控制接口即完成控制的目的。实现PID纵向速度控制，完成代码编写。

2023-11-07 17:40:57 2271 6

原创自动驾驶控制算法---离散规划轨迹的误差

通过离散的规划点来近似计算出投影点的信息，然后代入误差的计算公式得到的值，代入控制公式算出使误差趋于0的控制量。

2023-11-03 21:36:25 82

原创自动驾驶控制算法---求解误差微分方程（LQR算法及基于CARLA的Python代码实现）

使用LQR算出反馈控制的k值，然后利用k去算出前馈控制，此时施加控制u就满足误差稳态是0的控制要求了。

2023-11-01 21:25:02 989

原创自动驾驶控制算法---横向误差微分方程

找到误差err与横向位移vy和横摆角φ的关系，推导得出误差微分方程。

2023-10-31 22:53:13 218

原创自动驾驶控制算法---动力学方程

动力学方程实现控制前轮转角来控制横向位移与横摆角。

2023-10-31 10:35:27 183

原创自动驾驶控制算法---运动学方程

三个坐标系，构建自行车模型，得出车辆的运动学模型。

2023-10-30 16:41:23 290 1

weixin_46072670的博客