强化学习
文章平均质量分 83
大橙子老师
以后只出干货,为了能出精品,会放慢更新博客速度。如有问题,小编看到会认真答复的
展开
-
基于强化学习工具箱的自适应巡航控制系统
随着自动驾驶技术的快速发展,自适应巡航控制系统越来越多的人了解。今天介绍下用MATLAB中reinforcement learning工具箱实现对ACC系统的控制。ACC系统简单介绍自适应巡航控制系统(ACC)是一种旨在帮助车辆保持安全跟踪距离并保持在限速范围内的系统。其通过安装在车辆内的传感技术(如摄像头,激光器和雷达设备)来发挥作用,从而可以了解一辆汽车与另一辆汽车或道路上其他物体的距离,该系统通过调整自我车辆的纵向加速度来跟踪设定的速度并保持与前车的安全距离。DDPG算法介绍首先来回顾下DQ原创 2022-04-05 19:25:49 · 2348 阅读 · 9 评论 -
手动用MATLAB实现Policy Gradient
留作文本,过段时间更新原创 2020-08-14 23:19:16 · 1238 阅读 · 2 评论 -
matlab手动实现基于DQNCartPole问题
不用强化学习工具箱的DQN算法案例与matlab代码(二)== DQN问题==1.首先DQN与Q-learning算法区别:MATLAB手动实现DQN最短路径问题2.:为何为Q网络引入带有标签的数据DQN问题解答比较好的网址,大家可以点进去好好看看== cartpole问题==环境设置:CartPole问题描述见链接。参数设置见代码。奖励设置: 每一步给出的奖励为0,当满足norm(state(3),state(4))<0.01时,奖励为10;当杆子与竖直方向角度大于10或者移动范围原创 2020-08-14 23:13:10 · 2471 阅读 · 2 评论 -
关于强化学习不可行动作处理问题
在强化学习学习过程中,往往存在这样一种问题:总的动作空间很大,但是在特定状态下有些动作不可行,如何处理?例如:迷宫问题中当智能体处于迷宫边缘(1,1),此时采取向左或者向上的动作都会超出迷宫边缘。在现实生活中确实有很多不可执行的动作,受到很多约束限制。目前所了解到的处理方式有以下几种:把动作集分为两部分:可执行动作和不可行执行动作。在选择动作的时候在可行动作的范围内。通过对动作设置惩罚项(目前是最常用的)大家还有什么好的方法么?欢迎评论...原创 2020-06-25 16:26:33 · 3496 阅读 · 14 评论 -
MATLAB手动实现DQN最短路径问题
不用强化学习工具箱的DQN算法案例与matlab代码本文建立在已经有DQN基础知识之上。案例说明:环境设置:这是一个30*30的矩阵迷宫,其中有两个状态obstacle(15,15),Goal(25,25),目标就是Agent如何不碰到障碍物可以到达Goal.奖励设置:当Agent到达obstacle状态时reward=-1;当Agent到达Goal状态时reward=1;其他状态下reward=0.状态设置:所在方块中x,y为状态;动作设置:上,下,左,右。并且设置了随机性,当选动作上时,有原创 2020-05-22 22:51:41 · 7630 阅读 · 32 评论 -
强化学习matlab工具箱应用
众所周知reinforcement learning Toolbax for matlab是非常强大的,小编刚开始使用时走了很多弯路,有试过一层一层的去找调用的函数等等,看过底层的同学就知道用类做的集成,如果你的面向对象基础知识很牢固大概能看懂这其中的奥秘。小编研究下去的结果就是快吐了,其实没有必要这样。接下来想说下如何快速上手编写强化学习的代码。小编以用DQN训练Cart-Pole为例:原创 2020-03-11 19:27:48 · 15735 阅读 · 31 评论