OpenAi multi-agent 多智能体环境-CSDN博客这篇文章写到的maddgp算法基于tensorflow1.**,而目前pytorch的应用也极为广泛,这里用到starry-sky6688的MADDPG-master这一套代码:GitHub - starry-sky6688/MADDPG: Pytorch implementation of the MARL algorithm, MADDPG, which correspondings to the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments".
环境创建和openAI的Multiagent-particle-envs的下载与安装可以可以参考OpenAi multi-agent 多智能体环境-CSDN博客中的介绍。需要提前安装一下依赖:
pip install gym==0.10.5
pip install pyglet==1.5.9
pip install torch==1.7.0+cpu torchvision==0.8.1+cpu torchaudio===0.7.0 -f https://download.pytorch.org/whl/torch_stable.html
pip install numpy==1.19.5
pip install matplotlib
pip install tqdm
.......
缺少什么装什么,注意版本问题。
下面来看starry-sky6688的MADDPG-master代码和mpe环境的配置过程
下载starry-sky6688的MADDPG-master代码
git clone https://github.com/starry-sky6688/MADDPG
将mpe环境中的multiagent文件夹,拷贝到MADDPG工程目录下(拷贝到MADDPG-master/common 文件夹下),如下图。
在pycharm 中将 common文件夹 Mark Directory as Source Root, 这一步是为了MADDPG工程能够较好的调用multiagent中创建的环境,如图所示。
跳转main.py 所在文件夹,运行main进行测试:
cd MADDPG
python main.py --scenario-name=simple_tag --evaluate-episodes=10
出现如下画面,证明配置成功。