Reinforcement Learning
MADRLer
DRL算法工程师
展开
-
强化学习实战(一):用值迭代和策略迭代解决Frozen Lake问题
强化学习实战(一):用值迭代和策略迭代解决Frozen Lake问题Frozen Lake 问题值迭代(Value Iteration)和策略迭代(Policy Iteration)CodeReferenceFrozen Lake 问题 Winter is here. You and your friends were tossing around a frisbee at the pa...原创 2019-04-12 16:14:14 · 6402 阅读 · 0 评论 -
强化学习实战(二):用Q-Learning和SARSA解决出租车问题
强化学习实战(二):用Q-Learning和SARSA解决出租车问题1. 出租车问题问题描述2. Q-Learning和SARSA理论部分暂略2.1 Q-Learning2.1.1 伪代码2.1.2 流程图2.2 SARSA2.2.1 伪代码2.2.2 流程图3. 代码实现3.1 环境代码的一些解释3.2 Q-Learning3.3 SARSA4.Reference1. 出租车问题问题描述T...原创 2019-04-17 13:56:51 · 3272 阅读 · 4 评论 -
安装Multi-Agent Particle Environment
安装Multi-Agent Particle EnvironmentCiteInstallMADDPG(暂略)Cite[1] https://github.com/openai/multiagent-particle-envs[2] https://arxiv.org/pdf/1706.02275.pdfInstall官方的教程是针对Linux系统的,笔者希望在Windows系统下仍然可...原创 2019-04-29 14:43:36 · 6222 阅读 · 10 评论