强化学习入门项目spinning up(1)安装

本文档记录了在Ubuntu系统中安装Spinningup的详细过程,包括创建Anaconda环境、安装OpenMPI、解决mpi4py安装问题以及验证安装成功的步骤。Spinningup是一个用于强化学习(RL)教育和研究的资源集合,包含了RL的基础理论介绍、重要论文列表和可复现的算法实现。文章还提供了训练和测试RL算法的实例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

0.前言

在这里插入图片描述
好久之前就看到很多人推荐学习spinning up,无奈自己电脑只有win系统。最近终于在实验室的新机器上装好了双系统,于是最近打算进行spinning up的系列学习。

整个项目包括以下内容:

  • 对 RL 术语、算法种类和基础理论的简短介绍。
  • 一篇关于如何成长为 RL 研究角色的文章。
  • 按主题组织的重要论文的精选列表。
  • 一个有据可查的代码库,包含关键算法的简短、独立的实现,以及一些作为热身的练习。

本篇文章主要记录spinning up的安装过程。

差点忘记分享spinning up的链接了。
中文文档链接:https://spinningup.qiwihui.com/zh_CN/latest/index.html
英文文档链接:https://spinningup.openai.com/en/latest/index.html
github地址:https://github.com/openai/spinningup

安装的过程主要是下图的五个部分。
在这里插入图片描述

1.安装python

这部分我们按照文档说明安装,首先我们需要有anaconda,这个python包管理软件我相信大家都熟悉,就不多说了。

通过下方命令创建名为spinningup的一个新环境

conda create -n spinningup python=3.6

在这里插入图片描述
在这里插入图片描述
要在刚创建的环境中使用Python,可以通过下面的命令激活环境:

conda activate spinningup

在这里插入图片描述

2.安装 OpenMPI

OpenMPI作用:为了实现RL并行 (采样和网络更新等)

sudo apt-get update && sudo apt-get install libopenmpi-dev

在这里插入图片描述

3.安装 Spinning up
git clone https://github.com/openai/spinningup.git
cd spinningup
pip install -e .

在这里插入图片描述
有可能你会遇到下面的报错:
在这里插入图片描述
也就是mpi4py安装失败
参考:https://blog.csdn.net/CAIYUNFREEDOM/article/details/121750296
使用conda install mpi4py对其单独安装
在这里插入图片描述
然后再次执行一遍

pip install -e .

在这里插入图片描述
可以看到没有报错了。

4.检查安装成功与否
python -m spinup.run ppo --hid "[32,32]" --env LunarLander-v2 --exp_name installtest --gamma 0.999

在这里插入图片描述
训练过程:
在这里插入图片描述
训练完毕:
在这里插入图片描述
训练结束后,观看有关训练过的策略的视频:

python -m spinup.run test_policy data/installtest/installtest_s0

在这里插入图片描述
绘制训练曲线:

python -m spinup.run plot data/installtest/installtest_s0

在这里插入图片描述

5.安装 MuJoCo(可选)

这里先不安装,如果想要安装可以参考官方文档进行。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值