教AI打星际2也不难,试试暴雪和DeepMind的工具包 | 附论文+代码

本文来自AI新媒体量子位(QbitAI)

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

去年年底,DeepMind宣布想教会AI智能体玩《星际争霸2》(后简称星际2),计划创造出能击败人类玩家的智能体。

9个多月后这事又有了进展。今天,DeepMind和暴雪娱乐发布了星际2中加速AI研究的工具SC2LE。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

难!难!难!

星际2是个实用的基础AI研究环境,因为游戏本身复杂多变,且胜利方式不固定。

玩家想要取胜需要同时做多手准备,比如管理并创造资源、指挥军事单位和部署防御结构等操作需要同时进行,逐步完成。此外,玩家还需预测对手的策略。

这项任务确实不容易,但不是无解。DeepMind和暴雪尝试将游戏分为多个“迷你游戏”,将不同任务分解成“可管理的组块”,比如建立特定单元、收集资源或在地图上移动等。

细分是为了方便研究人员进行不同任务的测试比较及细化,最终在智能体中组合,从而教会智能体通关整个游戏。

0?wx_fmt=gif&wxfrom=5&wx_lazy=1

厉害的SC2LE

目前,暴雪和DeepMind在开放的环境平台中加入了SC2LE工具包,加速AI研究。

SC2LE包括——

机器学习API:由暴雪开发,将研究人员和开发人员接入游戏,并自带首次发布的Linux工具包。至此,Windows、Mac与Linux系统均可在云端运行。

匿名游戏回放数据集:包含65000多场游戏记录,在接下来的几周将增加至50万场,帮助实现智能体间的离线比赛。

开源的DeepMindPySC2工具包:方便研究人员使用暴雪的特征层API训练智能体。

一系列简单的增强学习迷你游戏:帮助研究人员在特定任务上测试智能体的性能。

概述开发环境的论文:记录了迷你游戏的初始基线结果、监督学习数据以及智能体间完整的对抗记录。

DeepMind希望通过此举,推动更多研究社区和开放工具的开发。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

相关资源

如果你也想小试牛刀,不妨移步这些Code与Paper看看——

机器学习API:

https://github.com/Blizzard/s2client-proto

匿名游戏数据集:

https://github.com/Blizzard/s2client-proto#replay-packs

DeepMind PySC2数据集:

https://github.com/deepmind/pysc2

论文地址:

https://deepmind.com/documents/110/sc2le.pdf

DeepMind官方介绍:

https://deepmind.com/blog/deepmind-and-blizzard-open-starcraft-ii-ai-research-environment/

—— ——

本文作者:安妮 
原文发布时间:2017-08-10
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值