GoBigger:多智能体决策智能环境

GoBigger:多智能体决策智能环境

GoBigger [ICLR 2023] Come & try Decision-Intelligence version of "Agar"! Gobigger could also help you with multi-agent decision intelligence study. 项目地址: https://gitcode.com/gh_mirrors/go/GoBigger

项目介绍

GoBigger 是一个高效且直观的 agar-like 游戏引擎,专为游戏 AI 开发而设计。该游戏类似于 Agar,玩家在一个地图上控制一个或多个圆形球体,目标是尽可能多地吞食食物球和其他比自己小的球体,同时避免被更大的球体吞食。每个玩家从一个小球开始,当球体达到一定大小时,玩家可以将其分裂成两个,从而控制多个球体。

GoBigger 特别关注以下几点:

  • 合作比单独行动更有回报。
  • 在小区域内容易爆发激烈的竞争。
  • 可扩展的环境,能够模拟各种团队和每个团队中的多个智能体。
  • 丰富的动作空间和部分可观察的观察空间。
  • 更详细的配置,适用于不同类型的小游戏。

项目技术分析

GoBigger 提供了丰富的接口,使用户能够轻松地与多智能体环境进行交互。用户可以通过提供的接口获取游戏中的观察数据,并应用操作来控制智能体。GoBigger 的规则和动作简单,但观察空间复杂。

基本规则

  • Match:GoBigger 允许多个智能体加入一个比赛。比赛中有很多不同的单位,如食物球、刺球、孢子球和克隆球。比赛结束时,每个智能体通过吞食其他球体来获得更大的尺寸,从而获得更高的排名。
  • Agent:每个智能体控制一个团队,包括多个玩家。团队合作对于智能体与其他智能体对抗至关重要。
  • Player:每个玩家从一个球开始。为了提高游戏的可操作性,GoBigger 提供了几种操作,包括 spliteject
  • Ball:GoBigger 在比赛中提供了 4 种类型的球体。

观察空间

GoBigger 提供了丰富的可观察信息,观察空间可以分为两部分:全局状态和玩家状态。全局状态提供与整个比赛相关的信息,如地图大小、比赛总时间和剩余时间,以及带有团队名称和分数的排行榜。玩家状态则提供了玩家在其视野内的所有球体的信息。

动作空间

在比赛中,球体只能移动、分裂和喷射。因此,动作空间主要包括:

  • 玩家球体的移动方向。
  • 分裂:当球体达到足够大小时,玩家可以将其分裂成两个。
  • 喷射:玩家球体可以在移动方向上喷射孢子。

项目及技术应用场景

GoBigger 适用于多种应用场景,包括但不限于:

  • 游戏 AI 开发:开发者可以使用 GoBigger 来训练和测试多智能体游戏 AI,探索合作与竞争的策略。
  • 决策智能研究:研究人员可以利用 GoBigger 的环境来研究多智能体决策问题,特别是在部分可观察的环境中。
  • 教育与培训:GoBigger 可以作为教学工具,帮助学生理解多智能体系统、决策理论和强化学习等概念。

项目特点

  • 高效且直观:GoBigger 提供了简单易用的接口,使用户能够快速上手并进行开发。
  • 可扩展性:环境支持模拟各种团队和每个团队中的多个智能体,适用于大规模的实验和研究。
  • 丰富的观察空间:提供了详细的观察信息,帮助智能体更好地理解环境和做出决策。
  • 多样化的动作空间:支持多种操作,增加了游戏的策略性和复杂性。
  • 实时交互:用户可以在个人电脑上实时玩 GoBigger,体验游戏的乐趣并测试自己的策略。

GoBigger 是一个功能强大且灵活的平台,适用于各种多智能体决策智能的研究和开发。无论你是游戏开发者、研究人员还是学生,GoBigger 都能为你提供一个有趣且富有挑战性的环境。快来加入我们,探索 GoBigger 的无限可能吧!

GoBigger [ICLR 2023] Come & try Decision-Intelligence version of "Agar"! Gobigger could also help you with multi-agent decision intelligence study. 项目地址: https://gitcode.com/gh_mirrors/go/GoBigger

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

岑晔含Dora

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值