OpenAI Gym--智能体

这是目录

Agents 智能体

“智能体”描述了针对健身房中的环境运行RL算法的方法。智能体可以包含算法本身,也可以简单地提供算法与健身房环境之间的集成。

RandomAgent 随机智能体

位于此仓库中的样本智能体gym/examples/agents/random_agent.py。这个简单的智能体利用环境的能力来产生随机的有效动作,并且针对每个步骤都这样做。

cem.py

位于此存储库中的通用交叉熵智能体gym/examples/agents/cem.py。考虑到前20%的“精英”,该智能体默认为25集的10次迭代。

dqn

这是一个非常基本的DQN(具有体验重播)实现,它使用OpenAI的健身房环境和Keras / Theano神经网络。/ sherjilozair / dqn

简单DQN

使用Neon深度学习库可轻松,快速且轻松地扩展DQN实现。带有开箱即用的工具来训练,测试和可视化模型。有关详细信息,请参阅此博客文章或查看回购

AgentNet

该库可让您开发与Theano / Lasagne完全集成的自定义深度/卷积/循环强化学习代理。还包含用于各种强化学习算法,策略,内存扩充等的工具包。

rllab

与OpenAI Gym完全兼容的用于开发和评估强化学习算法的框架。它包括各种各样的连续控制任务以及许多算法的实现。/ rllab / rllab

keras-rl

keras-rl实现了一些最新的深度强化学习算法。它与OpenAI健身房建于心,并且还内置了深入的学习库顶Keras并采用类似的设计模式,如回调和用户自定义指标。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值