windows版本的多智能体MADDPG

安装

maddpg依赖的环境是: Python (3.5.4), OpenAI gym (0.10.5), tensorflow (1.8.0), numpy (1.14.5),

GitHub源码分为环境和算法两个部分:

环境

openai/multiagent-particle-envs: Code for a multi-agent particle environment used in the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments" (github.com)https://github.com/openai/multiagent-particle-envs算法

openai/maddpg: Code for the MADDPG algorithm from the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments" (github.com)https://github.com/openai/maddpg

1.解压缩maddpg-master.zip和multiagent-particle-envs-master.zip
2.在maddpg-master文件夹外层目录运行命令pip install -e maddpg-master
3.在multiagent-particle-envs-master文件夹外层目录运行命令pip install -e multiagent-particle-envs-master
4.设置系统环境变量,把multiagent-particle-envs-master所在路径加入系统path中

出错:


1. 运行:python train.py --scenario simple时出错:ImportError: cannot import name ‘prng’ from ‘gym.spaces’。

gym版本问题,解决方案:pip install gym==0.10.5
2.错误:ModuleNotFoundError: No module named ‘tensorflow.contrib’,

解决方案pip install tensorflow==1.14.0

3.训练结束,写文件时出错

Traceback (most recent call last):
File “train.py”, line 193, in
train(arglist)
File “train.py”, line 182, in train
rew_file_name = arglist.plots_dir + arglist.exp_name + ‘_rewards.pkl’
TypeError: can only concatenate str (not “NoneType”) to str
解决方案:修改train.py第182行为rew_file_name = str(arglist.plots_dir) + str(arglist.exp_name) + '_rewards.pkl'
第185行为agrew_file_name = str(arglist.plots_dir) + str(arglist.exp_name) + '_agrewards.pkl'
4.显示图形界面,修改train.py第32行为

parser.add_argument("--display", action="store_true", default=True)

5.将环境测试指令中的 simple 改为 multiagent/scenarios 文件夹中的其他场景进行实验。

能够跑通simple场景的程序,但是代码14行换其他场景,就出错

解决方法:将程序所在根目录(D盘、E盘...)找到tmp文件夹,打开会看到policy文件夹,将policy文件夹清空,并将程序恢复默认设置(display为False,跑通后再变True)

6.训练完之后报错

FileNotFoundError: [Errno 2] No such file or directory: ‘./learning_curves/_rewards.pkl’

在跟experiments同级目录下,手动创建一个learning_curves文件夹,当然也可以注释掉这几行数据保存的代码,毕竟不影响训练的结果

原理及使用介绍:

MADDPG算法代码分析

翻译

MADDPG 论文翻译

  • 6
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值