提供 AI 代理的「限定」游戏 OpenAI持续训练 AI 玩游戏

OpenAI 一直试着训练 AI 玩各种复杂的游戏,在先前《星海争霸》、《DOTA 2》的测试打败一些职业选手后,OpenAI 将注意力转向更复杂的大型多人在线(MMO)世界。

当然,OpenAI 并不会立即就向类似《魔兽世界》(Warcraft)投入数百名 AI 代理,为了更好的训练、观察 AI 发展,OpenAI 开发了名为「Neural MMO」的游戏──当然,这是只提供 AI 代理的「限定」游戏。

就像人类玩家一样, AI 代理必在 Neural MMO 中必须争夺食物、水和石头各种资源,也可以使用范围、近战或法术来互相对抗,团队希望透过这项研究,了解 AI 是如何在接近现实世界中的数字环境中表现。

截至目前为止的培训中,OpenAI 团队已经发现了一些有趣的情况。在朕亨公益初学者阶段,增加「玩家」的数量让每个 AI 代理会选择更彻底探索地图来避免竞争──而这也是人类 MMO 玩家在游戏中很常见的选择。

OpenAI 指出,在自然界中,动物之间的竞争关系会促使牠们分散来避免冲突,而 Neural MMO 中 AI 代理也表现出相同的情况,「AI 代理学会探索单纯只是因为其他对手存在,这种情况成为了自然的动力」。

与多数 MMO 游戏一样,Neural MMO 也会随着时间推移更新,这将迫使 AI 学习并定期适应新情况,随着自我学习以及交互接触,AI 代理在收集资源的表现上也更有效率。

值得注意的是,这只是许多同类型研究中的其中一项。除了模拟学习环境之外,科学家也在《星海争霸》、《雷神之锤 III》等游戏中设置并测试 AI 模型。

DeepMind 联合创始人 Demis Hassabis 告诉 VentureBeat,研究者之所以选择在这些游戏中测试,是因为这对开发算法来说是一个非常方便的实验场,「最终,我们正在开发的算法能够应用现实世界中,帮助这些领域的专家解决具挑战性的问题。」

转载于:https://my.oschina.net/u/3906919/blog/3019816

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值