AI版“大逃杀”!通过游戏不断增强AI的适应性和学习能力

长期以来,游戏一直是衡量人工智能技术进步的方式,通过在策略中与顶尖人类玩家进行较量来展示算法的“智能”程度。

纽约大学坦登工程学院副教授朱利安·托格利乌斯说过:“电子游戏提供了我们所拥有最好的智力测试。电子游戏是一种优秀的训练AI算法的方式,因为它们循序渐进地让人类的思维经历越来越难的挑战。

电子游戏旨在通过让玩家专注于克服障碍和跟随后续故事等元素来挑战人类的思维。这使得电子游戏成为训练AI的理想环境。游戏提供的结构框架、重复训练以及能力强化,这都有助于人工智能的算法学习。

其实通过游戏训练AI并不是最近才出现的,早在数年之前OpenAI就已经通过游戏训练AI了,为此他们还推出了一个叫做 Neural MMO的大型多人在线游戏。在这个游戏中所有的“玩家”都是AI 。

值得注意的是,和人类玩家不一样,在AI的“认知”中他们是不知道一局游戏结束后是可以“重生”的。而AI认为自己只有一次生命,会根据自己的逻辑坚定地执行“活到最后”的指令。

当进入游戏的AI变多后,AI们也会做出决策,自发地开拓地图的角落避免争端,而每一个AI做出的决策,都会在一定程度上影响到别的AI的决策选择,情况可以说是瞬息万变。

简单来说,这个游戏就是一个AI的“斗兽场”,最后活下来的AI适应性和学习能力一定是最强的那个。OpenAI就是这样不断的进行游戏来增强AI的适应性和学习能力。

在长久的生物进化过程中,活下来的动物们都各自进化出了各自的特征,人类是其中的佼佼者,进化出了对自己而言最适合生活在这个世界的特征以及生活方式。而以“人类”为最终目标的AI,进化的方向自然也是这样,更多的是“思考方式”上的进化。

将AI置于游戏世界中进行训练,用这种策略研究是一个合乎逻辑的选择,它看起来也是合适的选择。无论是人工世界还是自然世界,此类活动都有一个根本点:让人工智能做好准备,进入最大的游戏——现实。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值