![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
文章平均质量分 60
小雅不采薇
机器学习的小白(小黑也可以)
一直想用强化学习做狗,做狗还是作狗?
展开
-
强化学习入门(更新中......)
废话不多说,此篇文章用于记录强化学习的入门学习过程。环境一:taxi-v3环境描述: 出租车载客环境的地图尺寸为5*5,其目的是正确的将乘客送到指定的位置。解决代码: %%time import numpy as np import gym def restore(npy_file='./q_table.npy'): Q = np.load(npy_file) print(npy_file + ' loaded.') return Q def sa原创 2021-04-05 22:50:09 · 626 阅读 · 2 评论 -
DQN强化学习 MountainCar Deep Q-Learning
虽则你我被每粒星唾弃,我们贫乏却去到金喜。 ———七百年后这篇文章关于神经网络的Qlearning实现,Qlearning的一些方法概念写在第一篇文章 “强化学习:Q表格方法”里:文章链接: https://blog.csdn.net/weixin_43968987/article/details/112959287对于Qlearning的方法,适用于动作空间是离散的环境,比如说象棋中的棋子,只能以有限的运动状态运动。我们可以看到,使用表格的方法解决较为复杂的环境,很容易使得表格变得很大,因为原创 2021-01-23 18:52:44 · 1306 阅读 · 8 评论