强化学习
文章平均质量分 55
crud_player
这个作者很懒,什么都没留下…
展开
-
关于深度强化学习框架的选择
入门深度强化学习之后,如何学习经典论文的代码是一个问题。一方面可以通过github上搜索解决这个问题,但质量参差不齐,尝试之后无法跑通会浪费大量时间;另一方面许多优秀的团队开发了深度强化学习的开源框架,结合文档,可以很快上手,阅读源码也可以学习优秀的代码风格。 我也面临学习强化学习算法代码的问题。今天看到一篇分析各种强化学习框架的文章(该文章发布于2019年):A Comparison of Reinforcement Learning Frameworks: Dopamine, RLLib, Ke原创 2021-04-09 11:10:15 · 2052 阅读 · 1 评论 -
bellman operator 和bellman equation概念区分
在阅读强化学习相关的论文时经常会遇到bellman operator和bellman equation,例如:状态动作值函数的贝尔曼等式:状态动作值函数的贝尔曼算子:那么这两个东西到底有什么区别呢?首先给出结论,这两个东西的等价的。证明如下:vπ(s)=∑a∈Aπ(a∣s)(Rsa+γ∑s′∈SPss′avπ(s′))v_{\pi}(s)=\sum_{a \in \mathcal{A}} \pi(a \mid s)\left(\mathcal{R}_{s}^{a}+\gamma \sum_{s^{原创 2021-04-07 16:53:47 · 1380 阅读 · 2 评论 -
最详细的distributional RL 解读
读完有一种豁然开朗的感觉,强推!https://mtomassoli.github.io/2017/12/08/distributional_rl/原创 2021-04-05 17:37:53 · 380 阅读 · 0 评论 -
安装Atari模块
很多benchmark算法都是在Atari游戏上做实验,所以有必要学习使用Atari游戏环境做强化学习。这里说一下安装Atari游戏模块的方法以及安装中遇到的问题安装步骤pip install gym[atari]pip uninstall atari_pypip install --no-index -f https://github.com/Kojoley/atari-py/releases atari_py第一步做完后也会安装atari-py-0.2.6,然后在运行 import gy原创 2020-12-02 11:25:19 · 4024 阅读 · 2 评论