windows版本的多智能体MADDPG

最新推荐文章于 2024-04-08 19:47:16 发布

strongera569

最新推荐文章于 2024-04-08 19:47:16 发布

阅读量2.4k

点赞数 6

分类专栏： tensorflow 文章标签： tensorflow python

本文链接：https://blog.csdn.net/strongera569/article/details/121318617

版权

tensorflow 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

安装

maddpg依赖的环境是: Python (3.5.4), OpenAI gym (0.10.5), tensorflow (1.8.0), numpy (1.14.5)，

GitHub源码分为环境和算法两个部分：

环境

openai/multiagent-particle-envs: Code for a multi-agent particle environment used in the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments" (github.com)https://github.com/openai/multiagent-particle-envs算法

openai/maddpg: Code for the MADDPG algorithm from the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments" (github.com)https://github.com/openai/maddpg

1.解压缩maddpg-master.zip和multiagent-particle-envs-master.zip
2.在maddpg-master文件夹外层目录运行命令pip install -e maddpg-master
3.在multiagent-particle-envs-master文件夹外层目录运行命令pip install -e multiagent-particle-envs-master
4.设置系统环境变量，把multiagent-particle-envs-master所在路径加入系统path中

出错：

1. 运行:python train.py --scenario simple时出错：ImportError: cannot import name ‘prng’ from ‘gym.spaces’。

gym版本问题，解决方案：pip install gym==0.10.5
2.错误：ModuleNotFoundError: No module named ‘tensorflow.contrib’，

解决方案pip install tensorflow==1.14.0

3.训练结束，写文件时出错

Traceback (most recent call last):
File “train.py”, line 193, in
train(arglist)
File “train.py”, line 182, in train
rew_file_name = arglist.plots_dir + arglist.exp_name + ‘_rewards.pkl’
TypeError: can only concatenate str (not “NoneType”) to str
解决方案：修改train.py第182行为rew_file_name = str(arglist.plots_dir) + str(arglist.exp_name) + '_rewards.pkl'
第185行为agrew_file_name = str(arglist.plots_dir) + str(arglist.exp_name) + '_agrewards.pkl'
4.显示图形界面，修改train.py第32行为

parser.add_argument("--display", action="store_true", default=True)

5.将环境测试指令中的 simple 改为 multiagent/scenarios 文件夹中的其他场景进行实验。

能够跑通simple场景的程序，但是代码14行换其他场景，就出错

解决方法：将程序所在根目录（D盘、E盘...）找到tmp文件夹，打开会看到policy文件夹，将policy文件夹清空，并将程序恢复默认设置（display为False，跑通后再变True）

6.训练完之后报错

FileNotFoundError: [Errno 2] No such file or directory: ‘./learning_curves/_rewards.pkl’

在跟experiments同级目录下，手动创建一个learning_curves文件夹，当然也可以注释掉这几行数据保存的代码，毕竟不影响训练的结果

原理及使用介绍：

MADDPG算法代码分析

翻译

MADDPG 论文翻译

strongera569

关注

6
点赞
踩
15

收藏

觉得还不错? 一键收藏
4
评论
windows版本的多智能体MADDPG

安装maddpg依赖的环境是: Python (3.5.4), OpenAI gym (0.10.5), tensorflow (1.8.0), numpy (1.14.5)，GitHub源码分为环境和算法两个部分：环境openai/multiagent-particle-envs: Code for a multi-agent particle environment used in the paper "Multi-Agent Actor-Critic for Mixed Coopera
复制链接

扫一扫

专栏目录