第三届腾讯「开悟」大赛启动,利用游戏复杂环境提升AI研究能力

感谢阅读腾讯 AI Lab 微信号第 151 篇文章。本文将介绍第三届腾讯“开悟”大赛启动情况。

8月18日,腾讯宣布第三届「腾讯开悟多智能体强化学习大赛」(下称「大赛」)正式启动。本届大赛由王者荣耀、腾讯 AI Lab、腾讯新文创总部、腾讯云计算中心、腾讯高校合作、腾讯游戏学堂等共同发起,旨在促进产学研合作,推动人工智能研究的发展。

dd9f5e82fd0fa73c0c9ff059cbe9dbc9.png

「开悟」是腾讯自主研发的 AI 开放研究平台。开悟具有首个高挑战MOBA模拟环境、自研AI框架及算法、高性能计算平台等,正逐步成为产学研结合的AI科研通用工具。同时,开悟平台依托于腾讯太极机器学习平台,可以实现更高效的资源调度,为使用者提供全栈打通的科研验证环境和辅助管理服务。

「开悟大赛」基于开悟平台而运行,为研究者开放王者荣耀游戏核心集群(Gamecore)及研究资源,并提供计算平台、评估工具以及其他研究支持服务,让参赛者得以测试并提升 AI 在 MOBA 游戏对战场景下的应用水平。

为了更好地支持开悟大赛,基于遨驰分布式云操作系统的新一代全球领先的异构加速引擎技术,腾讯云遨驰异构计算平台也为本届AI大赛提供了必不可少的资源及技术支持。

今年赛事延续往届邀请赛制,将参赛队伍数量扩大到 37 支,参赛队伍需要在指定的时间内,在给定的资源下训练出最优模型,并在王者荣耀 1v1、3v3 游戏测试环境中完成对局挑战。

此外,为进一步帮助更多研究者与爱好者降低研究门槛,开悟平台将于今年下半年启动分赛道「开悟成渝高校公开赛」的公开招募,成渝地区的高校学生均可报名,参与万元奖金角逐。

0b355ec0ddf76bb1090773f49ac59436.jpeg

第二届开悟大赛决赛对局

大赛鼓励参赛团队对解决方案、模型结构设计、强化学习算法设计和训练方式持续探索,本届赛事还致力于推动研究智能体研究领域的热门课题「模型泛化性」——即模型在从未见过的数据面前,仍然保持一定适用性的能力。

以一个「识别猫图像」模型为例,如果其训练数据仅有狸花猫的图片,它很可能在「识别狸花猫图像」任务上取得很好的结果,但却无法识别其他品种的猫。提高模型的泛化性,有助于以更低的成本,训练出能够应对更复杂问题的智能体,例如智能体可以使用之前从未见过的工具完成任务。

当前业界主要关注在单智能体在相近任务上的表现,主要分为两个方向:1) 在不同但相似的任务中迁移;2) 在相同任务不同智能体之间迁移。如 Meta World 和 RLBench 提出在模拟环境中控制机械手臂完成多个不同的动作任务,例如开窗通风、开门、取球等。

本届开悟大赛将模型泛化性问题融入到赛题中,能提升参赛团队在强化学习基础学术水平,同时激励他们的创新性思维碰撞,寻找提升模型泛化性的全新思路。

2019年至今,「开悟」AI 开放研究平台取得了多项成果:已成功主办两届「开悟多智能体强化学习大赛」、承办了成都大运会「世界大学生数智竞技邀请赛」AI赛道,并与国内多所顶级高校老师团队打造了创新课程合作项目等。

bddda9bf2851394aaac8d03d1309e6e1.jpeg

腾讯承办成都大运会数智竞技邀请赛

在赛事之外,「开悟」AI 开放研究平台也在沉淀高校合作成果:北京大学、电子科技大学、清华大学、中国科学技术大学等 4 所高校教师团队,基于开悟平台打造的多智能体及强化学习创新专业课程已正式开课。系列课程有助于帮助学生通过更有趣的方式掌握机器学习、强化学习、多智能体决策等关键知识点。截至今年,已有 19 所高校参与到了这个计划中。

据悉,中国科学科技大学参赛团队基于「开悟」赛事期间成果所产出的四篇游戏 AI 和强化学习相关论文,今年先后被 IEEE 学术会议及期刊收录。

8ab699fa39cee982b703ef4ed0703236.jpeg

腾讯人工智能科教联盟

基于「开悟」平台,腾讯 AI Lab 和王者荣耀将与学界、业界携手,共同利用游戏环境不断提升AI能力,并寻找 AI 技术解决更多问题的可能性,在机器人、医疗、工业、交通等领域发挥更大作用。

944b0da3d4d1dae7cfd88fce30bcb150.jpeg

* 欢迎转载,请注明来自腾讯AI Lab微信(tencent_ailab)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值