![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
DQN
mahuatengmmp
本账号已不再使用,所以发私信和评论是没用的
展开
-
Deep Q Learning伪代码分析及翻译
伪代码代码翻译及分析初始化记忆体D中的记忆N初始化随机权重θaction值的函数Q(Q估计)初始化权重θ-=θ target-action值的函数^Q(Q现实)循环: 初始化第一个场景s1=x1并且预处理场景s1对应的场景处理函数Φ 循环: 根据可能性ε选择一个随机动作at,or 或者选择一个最大值at从函数Q中在场景st下 ...原创 2019-09-08 14:17:55 · 3408 阅读 · 0 评论 -
[Deep Q Learning] pytorch 从零开始建立一个简单的DQN--走迷宫游戏
关于DQN的原理我不在这里说明了,如果对DQN的原理不了解可以去看我这个帖子https://blog.csdn.net/mahuatengmmp/article/details/100627005对DQN的伪代码做了翻译和分析环境:pytorchopencvnumpy首先建立一个游戏环境我是拿opencv做的显示效果,也可以不用opencv,具体因人而异场景首先需要建立一个游...原创 2019-09-13 15:08:57 · 9784 阅读 · 12 评论