Reinforcement Learning
pyxiea
双鸭山大学研究生,对深度学习、自然语言处理、推荐系统感兴趣
展开
-
强化学习入门
英文能力好的童鞋建议看原版视频,B站地址:https://www.bilibili.com/video/av39548965/ 看8-11集即可。看的过程会遇到一些前面章节提到的概念,例如minimax算法,忽略即可,对于总体理解强化学习并不影响。Marcov Decision Processes(MDP,马尔科夫决策过程)Reinforcement Learning(RL,强化学习)小结...原创 2019-06-20 11:46:46 · 2677 阅读 · 0 评论 -
Boltzmann/Softmax Exploration Strategy
Boltzmann/Softmax Exploration Strategy 玻尔兹曼探索策略转自: Google图书 《The Logic of Adaptive Behavior》转载 2019-09-17 12:30:08 · 3471 阅读 · 1 评论 -
module 'gym' has no attribute 'benchmark_spec'
新版本的gym移除了benchmark_spec,见 issue解决办法:安装旧版本的gym。具体做法:按照 这篇博客 下载2017年的gym源码(我下载的是17年2月的)。按照这篇博客 ,从源码安装gym。我使用的是pip install -e . (注意有个英文句号)...原创 2019-09-22 20:21:24 · 2468 阅读 · 0 评论