强化学习
文章平均质量分 63
IT猿手
这个作者很懒,什么都没留下…
展开
-
强化学习路径优化:基于Q-learning算法的机器人路径优化(MATLAB)
Q-learning算法中的Q表是机器人与环境交互后的结果,因此在Q-learning算法中更新Q表就是机器人与环境的交互过程。机器人在当前状态s(t)下,选择动作a,通过环境的作用,形成新的状态s(t+1),并产生回报或惩罚r(t+1),通过式(1)更新Q表后,若Q(s,a)值变小,则表明机器人处于当前位置时选择该动作不是最优的,当下次机器人再次处于该位置或状态时,机器人能够避免再次选择该动作action. 重复相同的步骤,机器人与环境之间不停地交互,就会获得到大量的数据,直至Q表收敛。原创 2023-07-03 22:43:15 · 2601 阅读 · 2 评论 -
基于强化学习(Reinforcement learning,RL)的机器人路径规划MATLAB
强化学习(Reinforcement learning,RL)求解机器人路径规划MATLAB原创 2023-06-18 08:56:27 · 388 阅读 · 0 评论