腾讯开悟「王者荣耀AI开放研究环境」启动申请,为学术研究提供探索平台

感谢阅读腾讯AI Lab微信号第 155 篇文章。本文介绍腾讯「开悟」平台「王者荣耀AI开放研究环境」正式启动申请。

11 月 21 日,腾讯「开悟」平台宣布开放「王者荣耀 AI 开放研究环境」申请,迈出全面开放的第一步。面向非商业用途的机器学习算法研究,「开悟」平台将提供业界独有的高复杂度 MOBA 训练环境,助力相关学术领域的前沿探索。

最新开放申请的「王者荣耀 AI 开放研究环境」,包含了王者荣耀 1v1 对战环境与 baseline 算法模型,当前支持 20 位英雄的镜像对战任务以及非镜像类对战任务,尤其适合研究竞争性强化学习中的泛化性与通用性问题。

现在,研究者只需在腾讯「开悟」平台官网注册账号、提交资料并通过平台审核,即可免费下载王者荣耀 1v1 测试环境 gamecore,在本地进行 AI 相关研究测试。

申请地址:(文末点击「阅读原文」)

https://aiarena.tencent.com/aiarena/zh/open-gamecore   

cd54100179eebe08a2b9c9654235f66b.jpeg

「王者荣耀 AI 开放研究环境」项目发布以来受到广泛关注,今年 9 月以 264 星登上 Github 9 月热榜,同时,相关论文已被 AI 领域的顶级国际学术会议 NeurIPS 2022 接收。

5c7148db32e4b157ec51ac635fbee17e.png

论文链接:https://openreview.net/forum?id=7e6W6LEOBg3

代码链接:https://github.com/tencent-ailab/hok_env

随着王者荣耀游戏在持续运营中成长迭代,「开悟」平台也将逐步探索并开放更多适用于AI研究的游戏测试环境,为 AI 业界面临的「缺乏高挑战测试环境」难题提供全新解决方案。

高复杂度、高挑战性的

智能体训练环境

在王者荣耀对战中,双方玩家互为竞争关系,需要收集资源的同时干扰对方,以达到赢得游戏的目的。作为一个具备多英雄、多玩法的复杂对抗游戏,王者荣耀的状态、动作空间复杂度比围棋等游戏高很多,是学术界研究复杂控制类问题的优质环境。

2019 年,腾讯 AI Lab 首次发布决策智能 AI「王者绝悟」的研究论文,介绍在王者荣耀 1v1 环境中研究用深度强化学习来为智能体预测游戏动作的方法,该论文被 AAAI 2020 接收。之后「王者绝悟」陆续攻克 5v5 挑战及全英雄池,在学术领域取得多项成就同时,也为王者荣耀玩家带来了「挑战绝悟」等创新玩法。

同年,王者荣耀及腾讯 AI Lab 联手打造「开悟」AI 开放研究平台,打造游戏 AI 产学研新生态。如今「开悟」正式开放王者荣耀 1v1 环境,并对环境进行了易用性封装,提供标准代码与训练框架,让个人用户在资源允许的情况下可以轻松上手分布式训练。

本次最新开放申请的「王者荣耀 AI 开放研究环境」在只考虑双方英雄选择条件下,支持 400 种对战子任务,如果算上召唤师技能,将会有 40000 种子任务,这对模型的泛化性有很大挑战,所以尤其适合研究竞争性强化学习中的泛化性与通用性问题。

研究模型对不同任务的泛化性,对降低 AI 在不同领域的应用成本至关重要。面对测试环境中的多个任务,如何在有限的资源和时间条件下获得最好的效果,这其中的研究方法论可以迁移到其他领域,比如机器人不同部位的控制等。

「开悟」AI开放研究平台

赋能产学研,共享AI新生态

「开悟」是腾讯牵头构建的AI多智能体与复杂决策开放研究平台,依托腾讯AI Lab和王者荣耀在算法、算力、实验场景方面的核心优势,为学术研究人员和算法开发者开放的国内领先、国际一流研究与应用探索平台。

目前,「开悟」也正在持续助力AI学界人才培养。2019年至今,「开悟」AI 开放研究平台已成功主办两届「开悟多智能体强化学习大赛」、承办了成都大运会「世界大学生数智竞技邀请赛」AI赛道,「以赛促研」为国内外青年研究人才提供测试及提升AI在复杂游戏场景下应用水平的机会。

2021年起,「开悟」先后与北大、清华、中科大等 19 所国内头部高校教师团队联合发起创新课程合作项目,已于多所高校陆续落地多智能体强化学习实践课程,帮助学生通过更有趣的方式掌握机器学习、强化学习、多智能体决策等关键知识点。

基于「开悟」平台,腾讯 AI Lab 和王者荣耀将与学界、业界携手,共同利用游戏环境不断提升AI能力,并寻找 AI 技术解决更多问题的可能性,在机器人、医疗、工业、交通等领域发挥更大作用。

4da9709850243fc60c4c98b46ea08d9c.jpeg

* 欢迎转载,请注明来自腾讯AI Lab微信(tencent_ailab)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值