Stable Baselines官方文档中文版

起这个名字有点膨胀了。

网上没找到关于Stable Baselines使用方法的中文介绍,故翻译部分官方文档。非专业出身,如有错误,请指正。

官方文档中文版汇总:Github:https://github.com/DBWangML/stable-baselines-zh

Stable Baselines是一组基于OpenAI Baselines的改进版强化学习(RL: Reinforcement Learning)实现。

Github网址: https://github.com/hill-a/stable-baselines

RL Baselines Zoo(预训练agents集合):https://github.com/araffin/rl-baselines-zoo

RL Baselines zoo也提供一个简单界面,用于训练、评估agents以及超参数微调。

你可以在Medium上查看一篇详细介绍Stable Baselines的文章:《Stable Baselines: OpenAI Baselines的分支:让强化学习更容易

  • 与OpenAI Baselines的主要区别

    此工具集源自OpenAI Baselines的一个分支,进行了主体结构重塑和代码清理:

    • 统一算法结构
    • PEP8兼容(统一代码风格)
    • 文档化的函数和类
    • 更多的测试&更多的代码覆盖
  • 用户向导

  • 引用Stable Baselines

    在作品中引用此项目:

    @misc{stable-baselines,
      author = {Hill, Ashley and Raffin, Antonin and Ernestus, Maximilian and Gleave, Adam and Traore, Rene and Dhariwal, Prafulla and Hesse, Christopher and Klimov, Oleg and Nichol, Alex and Plappert, Matthias and Radford, Alec and Schulman, John and Sidor, Szymon and Wu, Yuhuai},
      title = {Stable Baselines},
      year = {2018},
      publisher = {GitHub},
      journal = {GitHub repository},
      howpublished = {\url{https://github.com/hill-a/stable-baselines}},
    }
    
  • 贡献

    如有兴趣改进RL baselines,有很多工作需要做。具体待修事宜见 roadmap.

    如果你想参与,请先阅读CONTRIBUTING.md

  • 索引和表格

    • 索引
    • 搜索页面
    • 模型索引

更多详细内容见Github:https://github.com/DBWangML/stable-baselines-zh

  • 18
    点赞
  • 65
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值