OpenAI Gym--智能体

最新推荐文章于 2023-12-20 14:17:02 发布

Hiking_Yu

最新推荐文章于 2023-12-20 14:17:02 发布

阅读量681

点赞数

分类专栏：强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hiking_Yu/article/details/104250142

版权

强化学习专栏收录该内容

8 篇文章 2 订阅

订阅专栏

Agents 智能体

“智能体”描述了针对健身房中的环境运行RL算法的方法。智能体可以包含算法本身，也可以简单地提供算法与健身房环境之间的集成。

RandomAgent 随机智能体

位于此仓库中的样本智能体gym/examples/agents/random_agent.py。这个简单的智能体利用环境的能力来产生随机的有效动作，并且针对每个步骤都这样做。

cem.py

位于此存储库中的通用交叉熵智能体gym/examples/agents/cem.py。考虑到前20％的“精英”，该智能体默认为25集的10次迭代。

dqn

这是一个非常基本的DQN（具有体验重播）实现，它使用OpenAI的健身房环境和Keras / Theano神经网络。/ sherjilozair / dqn

简单DQN

使用Neon深度学习库可轻松，快速且轻松地扩展DQN实现。带有开箱即用的工具来训练，测试和可视化模型。有关详细信息，请参阅此博客文章或查看回购。

AgentNet

该库可让您开发与Theano / Lasagne完全集成的自定义深度/卷积/循环强化学习代理。还包含用于各种强化学习算法，策略，内存扩充等的工具包。

仓库在这里：AgentNet
Atari SpaceInvaders的分步演示

rllab

与OpenAI Gym完全兼容的用于开发和评估强化学习算法的框架。它包括各种各样的连续控制任务以及许多算法的实现。/ rllab / rllab

keras-rl

keras-rl实现了一些最新的深度强化学习算法。它与OpenAI健身房建于心，并且还内置了深入的学习库顶Keras并采用类似的设计模式，如回调和用户自定义指标。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。