- 博客(1)
- 收藏
- 关注
原创 Q学习算法举例(ma)lab实现)
q学习是强化学习的一种方式下面给出一个例子机器人只能向左向右向上向下四个方向走,有陷阱的方向不能走,机器只有0.8的概率按照指定方向走,其余可行的方向中均分0.2。给定初始位置和目标位置给出初始位置到目标位置的一条最短路径。在这里插入代码片% clear% clcn=18;%行数m=20;%列数
2020-07-12 20:38:42
1197
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人