谷歌通用AI智能体发布,3D游戏玩法要变天了

西风 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌DeepMind号称打造出了首个能在广泛3D虚拟环境和视频游戏中遵循自然语言指令的通用AI智能体

名为SIMA,不是NPC,是可以成为玩家拍档,帮忙干活打杂的那种。

099ba8bc53f58330a584ede62f2bb082.png

比如,在《模拟山羊3》(Goat Simulator 3)中当司机开开车:

0058d0f71eddc54df5f40c8352e3e7b1.gif

在《幸福工厂》(Satisfactory)中挖矿石:

f88f95879fc08131d543400501881eae.gif

在《瓦尔海姆》(Valheim)中寻找水源:

4ce4d748741286652ed74be709fe04da.gif

在《无人深空》中(No Man’s Sky)驾驶宇宙飞船射击小行星收集资源:

8fa4edae150b77b7aa2eee5bb9b9655e.gif

d930d76378328640b87f8a6a4b1f3a65.gif

……

SIMA全称Scalable Instructable Multiworld Agent,顾名思义可扩展、可指导、多世界。

之前,谷歌DeepMind在AI+游戏方面也做过许多工作,比如推出能和人类玩家打PK、会玩《星际争霸II》的AlphaStar系统。

而SIMA被DeepMind称作是一个“新的里程碑”,主打从适用单一游戏转向通用多种游戏,且可遵循语言指令。

659969c2b295628459decdf132706b22.jpeg

SIMA一公开,网友们也是讨论热烈。

让它们替我完成无聊繁琐的任务,这样我就可以直接做有趣的部分,而不必花几个小时培育chocobos获取随机召唤。

5f9fad0daca4e64d28bcebb46c4e7ccb.png

嗯…《最终幻想》(Final Fantasy)玩家无疑了。

专业《模拟山羊》玩家在此刻也懵了:

c6d0a1ff3e66d20118e78181fbf754bc.png

最近这一连串的AI进展也是整的网友们措不及防,直呼“慢一点”:

6b435ff0aad0f3aaedc164bd95c5f264.png

10秒内完成的简单任务

接下来再来看一波SIMA的表现。

为了让SIMA接触到更多游戏环境,开发团队表示目前已与八家游戏工作室合作,在九款不同的视频游戏上训练和测试了SIMA。

cc05d6859d1500cee5888b5dfa778999.gif

932cb4c098269ad0c26be514b6d0d5cb.gif

当前的SIMA已在600个基本技能上进行了评估。

73a4eac4b8cb1d5e36f9513def281961.gif

基本操作、交互、使用菜单都会:

566e5b7078265a62ee077846e372aa92.gif

简单的任务,10秒内可完成。

31fd07f7e527e3f2326244ab5223d926.gif

各种场景都能适应:

64f8d0f552a23efa682bfce71b85cec9.gif

除此外,谷歌DeepMind还发布了一份技术报告,一起来看看里面都有啥。

未见过的游戏也会玩

SIMA的整体架构是将预训练视觉模型与自监督学习的Transformer相结合。

从用户那里接收语言指令,并从环境中获取图像观察结果,然后将它们映射为键盘和鼠标动作。

具体架构如下图:

65516d7db5bdc64d2a53be6f599f7ff9.png

开发人员收集了一个既包括精选研究环境又包括商业视频游戏的大型多样化游戏数据集。

此外,他们还用Unity创建的一个新环境,名为“the Construction Lab”。在这个环境中,智能体需要使用积木构建雕塑,这考验了它们对物体的操纵能力和对物理世界的理解。

数据收集包含多种方法,比如让不同成对的人类玩家的互动,其中一名玩家观察并指导另一名玩家,以此来捕获语言指令;让玩家自由玩游戏,观察他们的操作,并记录下可能导致其游戏行为的指令。

13ccdd5f4da321eacf36fd749400c865.png

通过在不同的游戏世界中学习,SIMA能够将语言与游戏行为相结合。

06c1284ff30613fb1646e5177b2c635e.png

不需要访问游戏源代码,也不需要定制API,仅需要两个输入:屏幕上的图像和用户提供的简单的自然语言指令。

然后SIMA就会使用键盘和鼠标输出来控制游戏角色以执行这些指令,这一操作与人类类似,也就意味着SIMA有潜力与任何虚拟环境互动。

204cf2262c5e169199af57e3e929ddff.png

在评估测试中,研究人员表示SIMA在九个3D游戏集上接受训练,表现显著优于仅在单个游戏上专门训练的智能体。

4688d0e52a09df1366926a7981cbdc5e.png

而且SIMA在未训练过的游戏中的表现和专门使用该游戏数据集训练过的智能体表现一样好。

也就是说,SIMA在全新环境中具备泛化能力。

a61d5c78a714a7e01fb1bce5d3000a85.png

此外测试结果还显示,SIMA的性能依赖于语言。在一个控制测试中,智能体没有接受任何语言训练或指令,它就会出现无目的的操作,不遵循指令。

而且,和人类玩家相比较,SIMA水平还是差一点。

5c7d6370d3d60f981e097cd0267899bc.png

更多细节,感兴趣的家人们可以查看技术报告。

参考链接:
[1]https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/
[2]https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/sima-generalist-ai-agent-for-3d-virtual-environments/Scaling%20Instructable%20Agents%20Across%20Many%20Simulated%20Worlds.pdf

—  —

点这里👇关注我,记得标星哦~

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值