阿里开源Gym StarCraft 能帮助开发者体验强化学习

星际争霸一直是游戏玩家心目中即时战略类的经典之作,历时十多年而不衰。而如今它更成为深度强化学习、人工智能算法研究的一个主要平台和工具。因为其蕴含了多智能体协作、多任务学习、宏观策略规划等复杂问题,一旦取得部分突破和进展,对商业和社会发展都会带来极大影响。如国外的DeepMind、Facebook等公司相继投入大量人力基于它进行通用人工智能的研究。

在星际争霸的AI研究中,一直以来缺乏完善的工具链和开发环境。今年年初Facebook公司发布的TorchCraft打通了星际和Torch之间的桥梁,但却不支持主流的Python开发语言和TensorFlow深度学习框架;早前OpenAI公司发布的Gym算法平台虽然支持众多游戏环境下的算法验证和对比测试,但却缺少对星际的支持。

针对星际AI的这一现状,阿里巴巴率先开发了一套专业易用的研究平台Gym StarCraft,并且已经开源:https://github.com/deepcraft/gym-starcraft

在Gym StarCraft中,AI和强化学习研究者可以非常方便地使用Python语言来进行深度强化学习智能Agent的开发,它底层完成了对TorchCraft和OpenAI Gym的封装,支持基于TensorFlow和Keras等主流算法框架进行开发,仅需几十行代码即可完成一个基本的智能Agent的开发。

同时,便于评测智能Agent的有效性,Gym StarCraft被集成在了OpenAI Gym这一主流的强化学习AI评测平台中,支持世界各地的星际AI研究者基于它去进行公平、快捷的效果评估,为广大开发者提供了一个人工智能的开放协作研究平台。对于强化学习的普及和推广起着关键性作用。


更多人工智能精彩内容,可关注以下微信订阅号和加入技术专家群。

图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值