Agents 智能体
“智能体”描述了针对健身房中的环境运行RL算法的方法。智能体可以包含算法本身,也可以简单地提供算法与健身房环境之间的集成。
RandomAgent 随机智能体
位于此仓库中的样本智能体gym/examples/agents/random_agent.py
。这个简单的智能体利用环境的能力来产生随机的有效动作,并且针对每个步骤都这样做。
cem.py
位于此存储库中的通用交叉熵智能体gym/examples/agents/cem.py
。考虑到前20%的“精英”,该智能体默认为25集的10次迭代。
dqn
这是一个非常基本的DQN(具有体验重播)实现,它使用OpenAI的健身房环境和Keras / Theano神经网络。/ sherjilozair / dqn
简单DQN
使用Neon深度学习库可轻松,快速且轻松地扩展DQN实现。带有开箱即用的工具来训练,测试和可视化模型。有关详细信息,请参阅此博客文章或查看回购。
AgentNet
该库可让您开发与Theano / Lasagne完全集成的自定义深度/卷积/循环强化学习代理。还包含用于各种强化学习算法,策略,内存扩充等的工具包。
rllab
与OpenAI Gym完全兼容的用于开发和评估强化学习算法的框架。它包括各种各样的连续控制任务以及许多算法的实现。/ rllab / rllab
keras-rl
keras-rl实现了一些最新的深度强化学习算法。它与OpenAI健身房建于心,并且还内置了深入的学习库顶Keras并采用类似的设计模式,如回调和用户自定义指标。