window10安装多智能体强化学习平台(SMAC)

本文详细记录了在Windows环境下安装星际争霸2、配置Anaconda虚拟环境、安装PyTorch及其相关库SMAC的过程,包括环境变量设置、地图下载及代码运行测试。重点在于如何在非默认安装目录下解决路径问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近需要在window下跑星际争霸2的有关代码,用的是SMAC这个平台,因此记录一下安装过程,以作备忘。

1.星际争霸2安装

官网地址,直接下载安装就行,可以一路默认安装如果C盘够的话(需要大概30G),我是装在E盘,并设置系统变量SC2PATH,环境变量为星际争霸2的安装路径,如图所示:
在这里插入图片描述

2.环境搭建

之后代码均在anaconda的虚拟环境下运行,所以需要先创建好一个虚拟环境。

2.1 创建python环境

conda create -n sc2 pyhton=3.7
conda activate sc2

创建环境sc2,python使用3.7版本。

2.2 Pytorch安装

Pytorch官网
因为代码工程都是用torch写的,所以我选择安装torch,而且后面要用到torch-geometric这个包,而这个包对应的最低版本torch是1.4,所以就安装了Pytorch1.4.0版本。安装CPU版本还是GPU版本看个人需求,我的电脑上有显卡所以就装的GPU版本(虽然是GT 730的显卡),英伟达驱动版本如下:
在这里插入图片描述
直接按照官网对应版本的指令安装:

conda install pytorch==1.4.0 torchvision==0.5.0 cudatoolkit=10.1 -c pytorch

安装完后,执行如下命令没报错就没问题:

python -c "import torch; print(torch.version.cuda)"

CPU版本的话就直接安装:

conda install pytorch==1.4.0 torchvision==0.5.0 cpuonly -c pytorch

能够import torch不报错就没问题。

2.3 Torch-geometric库安装

这个库主要是代码有用到所以需要额外装一下,如果没有用到这个库就跳过。安装torch-geometric库前还要先装torch-scatter、torch-sparse、torch-cluster以及torch-spline-conv这四个包。从https://pytorch-geometric.com/whl/torch-1.4.0.html处下载对应版本的包。下载后在虚拟环境下将路径切换到文件的保存路径,分别进行安装:

pip install torch_scatter-2.0.3+cu101-cp37-cp37m-win_amd64.whl
pip install torch_sparse-0.5.1+cu101-cp37-cp37m-win_amd64.whl
pip install torch_cluster-1.5.2+cu101-cp37-cp37m-win_amd64.whl
pip install torch_spline_conv-1.2.0+cu101-cp37-cp37m-win_amd64.whl

安装成功后就可以安装torch-geometric库了:

pip install torch-geometric

可以用下面命令测试安装是否成功:

python -c "import torch_geometric"

不报错即可。

3.安装SMAC

直接按官方给的教程来:

pip install git+https://github.com/oxwhirl/smac.git

或者下到本地再装,我是下载到本地再装:

git clone https://github.com/oxwhirl/smac.git
pip install -e smac/

4.下载地图

从SMAC给的地址上下载对应的地图,并把解压后的对应文件夹(解压后应该有两个文件夹,只用到SMAC_Maps这个文件夹)放到安装目录下的Maps文件夹中。
ps:我的安装路径中没有Maps文件夹所以就建了一个Maps文件夹
之后可以使用如下命令查看平台的地图:

python -m smac.bin.map_list

在这里插入图片描述

5.运行

可以用如下指令测试:

python -m smac.examples.random_agents

能运行不报错,对应的星际界面能出来就安装成功了。

在这里插入图片描述

6.测试注意

因为我星际争霸没有在默认目录安装,所以在测试时会出现这个错误:

FileNotFoundError: [WinError 3] 系统找不到指定的路径。: 'C:/Program Files (x86)/StarCraft II\\Versions

这是由于我改了安装目录后,一些库按路径找不到文件了,解决方法是在自己的安装目录中把找不到的文件夹按上面说的路径复制一份放在C盘,重启电脑就好了

内容概要:本文提出了一种基于行动表示的方法来解决复杂环境中多智能体系统的角色发现和分配问题。具体来说,作者构建了一个新的框架,该框架能够将复杂的团队任务分解成低级别的子任务,并通过共享对任务的理解来提高协作效率。文中首先引入了动作编码器来构建每个动作的向量表示,并根据动作特性和贡献度区分角色。接着提出了基于表示的学习选择政策,考虑角色差异和奖励时间范围,使多个代理可以动态地切换相似能力的角色。为验证所提模型的效果,在星际争霸多智能体挑战(SMAC)基准测试中进行了实验,表明其相对于基线模型有显著改进,平均提升了约20%的胜率,特别在困难级地图上表现突出。另外还进行消融实验评估各组成部分的作用,证明各组件在提升性能方面均起到了重要作用。 适合人群:对于希望深入研究多智能体系统理论的研究者以及从事相关领域实际项目的技术人员;对于熟悉多智能体强化学习并且想了解前沿技术和新算法的学生和技术爱好者也非常有价值。 使用场景及目标:用于复杂环境下的智能体协调工作场景中,如游戏AI、机器人协作以及其他需要高效协作完成的任务情境下;旨在提高不同智能体之间的配合默契度,优化资源配置,增强团队的整体性能和成功率。 其他说明:本文强调了解决现有固定或静态划分方案不能很好地适应实时变化的问题,提供了从完全开放的动作空间里自动找到最适合当前任务状态的角色组合方式,并且通过调节奖励机制确保了训练过程中不出现频繁换岗导致训练不稳定的局面。此外,它展示了即使是在高度对抗性强的情况下也能保持较高稳定性的特性。同时,文章指出其方法在一些简单的不需要大量探索任务可能不会带来太大优势。
评论 19
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值