![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
强化学习
文章平均质量分 69
鹏阿鹏
软件工程本科,计算机硕士在读;兴趣:Java后端、Web前端、机器学习与算法。
展开
-
【强化学习】TensorFlow2实现DQN(处理CartPole问题)
CartPole问题:黑色小车上面支撑的一个连接杆,连杆会自由摆动,我们需要控制黑色小车,通过控制小车左右移动,保持连杆的平衡。该问题的动作空间是离散的且有限的,只有两种执行动作(0或1),但是该问题的状态空间是一个连续空间,且每个状态是一个四维向量。原创 2022-11-18 10:11:57 · 1670 阅读 · 6 评论 -
【强化学习】基于Qlearning的最短路径吃糖果(附源码)
Agent需要在方格地图中,找出一条路径吃掉所有糖果我们需要初始化一个Q(s,a)表,Q表有s行a列,对应s(state)种不同状态和a种不同的动作(action)。Q表中是每一个状态(s1,s2,…)所对应的是所有动作(a1,a2,…)的Q值。Q表可以帮助我们在某一个状态时,根据Q表中的值选择出一个最佳的动作,让我们能获得最大的收益。Qlearning算法流程如下:在其中:针对我们具体的问题,进行如下设置,为了便于进行Q表的更新,同时满足游戏要求:Q表的构造:对于Q表中的状态,由地图结果,构造0,原创 2022-07-06 12:41:27 · 1850 阅读 · 4 评论 -
【强化学习】gym安装及示例
OpenAI Gym是一款用于研发和比较强化学习算法的工具包,其中包含了各种环境、桌面游戏等计算任务。原创 2022-11-16 22:11:41 · 1894 阅读 · 0 评论