王者荣耀-绝悟

游戏方面不必多说,更想去探讨一下自己打不过的AI

从游戏出发,进入了人工智能领域,而且王者荣耀团队已经走得很远,甚至深入到了“通用人工智能”的边界。

可能有人听说过王者荣耀的AI机器人--绝悟,也就是’绝悟试炼‘,它背后的AI技术方向叫做“多智能体协作技术”。这个技术应用到现实就是机器人抢险、交通控制、金融博弈,甚至战争机器人。    

玩家于峡谷作战,AI从玩家中悟道

在计算机世界中,英雄没有玩家的“高端”操作,就没有其灵魂,也失去了原本的意义,只是一具空壳。

而王者荣耀AI团队要做的,就是赋予这些空壳灵魂,让他们动起来,完成“五连绝世”。

不得不赞叹王者荣耀团队的做法,以游戏为背景,以游戏为试炼场,以玩家做训练目标或对象,将这个游戏变成了人类在人工智能方面的悟道之地,千万行代码,谱写AI篇章。

策划美工人人喊打,而背后的指示者--总经理,则是与这款游戏相处已久的对象。

黄蓝枭,他是现任王者荣耀的执行制作人,也是天美L1工作室的总经理。

他们研究的命题则是--能不能用AI去战斗

不好好做游戏你在这里搞科研??我给你一个大鼻窦!

所以。。。他们真的在以游戏为背景搞科研?

如果这么想,那就大错特错!

在王者这么多英雄中,每一个英雄都经历过策划和团队的精心打磨,所以这也是当时困扰他们的一个问题

这个英雄太能打能抗怎么办?

那么最后只有两个结果,玩家自己打不过,放弃原来的英雄去练它或者开局禁用这个英雄。

游戏的平衡性就被破坏了。

但这个不慌,其实,在游戏开发界有一个祖传秘籍——新英雄发布之前,可以找很多专业游戏测试员,用它跟以前的英雄打上几千场。各种“骚操作’都尽量测试一遍,最终胜率在50%上下,那就说明它不比别人厉害也不比别人拉垮嘛。

但是问题始终存在,而且在王者荣耀这种大型即时对战游戏上极为突出。

1-玩家实在太多,你一招我一招,没准哪个鬼才发明了一种无解连招或者出装,游戏平衡性又没了。

2-想要测试的精准,就需要大量的人力去测试,拜托,打个几千场超累的好不好,所以成本也大大提升。

3-人一多,难免会把新英雄的消息放出来,那这压力就来到工作室这边,一上线的私信就是问新英雄什么时候上线

所以绝悟就是在这个环境下诞生的!

但是,现在还没到他出场的时候...

AI的本质就是学习加复读机,对于一个场景做出一系列或一个反应,场景越多,AI就越完善。

让我们把目光看向向往五杀的小兵,这个小兵就是一个上述的典型的AI,但是不大聪明,如果拿这种AI和玩家打无异于骑兵与坦克的对抗,所以你猜为什么不是兵线吃你而是你吃兵线。

问题来了,如果按这么计算,所需的技术约等于人类科技的极限。

训练一个AI能达到这个地步??

这估计是不少同学的问题。

我们印象中的AI对决并完胜人类的游戏要么是象棋要么是扫雷,那么问题来了,象棋游戏是回合制的,你一招我一招,1v1,有思考的时间,但是王者不一样啊,他是5v5,相当于是10个人在一起下棋,还不带停顿和犹豫的那种。

难题又出现了,像王者去做AI对抗玩家的游戏还真不多,没有什么参考目标,从某种意义上来说他们开了这一行的先河。

不难想象,从围棋到王者和二维到三维的差距差不多

差距有亿点大。

那就把对手所有的招数都想出来然后一一应对?也就是穷举法

没错,这个办法理论上可行,但是一局王者可能出现10的三万次操作,你让计算机怎么活。。。

穷举不行,那AI还可以学习啊。

绝悟最初打王者就是在不断的学习(学名:模仿学习)

模仿对象自然是各大职业选手。

当然,AI的学习模式是有奖有罚的,击败敌人奖励自己,被敌人击败惩罚自己。

弊端又出现了:AI没血了,直接原地回城,这在AI看来没有问题,如果我被击败,那么会收到惩罚,所以为了避免惩罚,我选择回城。

不过在设置完奖励值之后这种现象慢慢减少了。

完成了?

并没有,据说当时的绝悟连最普通的的AI(就是新手教程那几位)都打不过。

可以说是废铁段位。

还缺少什么?

职业选手有输有赢,绝悟是把输赢操作都学了。

人类打王者两个手打,绝悟是脑子一团浆糊,一只手操作。

后者的原因就是王者中分移动和出招,而绝悟是把这俩混一起的。

后期,绝悟的操作分区了,比如走位由第一训练系统操作,出招由第二训练系统操作。

经过这么一堆改进,绝悟的水平果然开始慢慢提高。

终于,将新手教程的AI战胜,大仇得报。

在后面的一段时期里,AI战队还挑战过人类职业选手战队,并成功翻盘取得胜利!

在无数个日夜下,绝悟终于站在了属于它自己的巅峰!


很多人可能还记得,2020年“五一”,正是很多人被疫情封在家的时候,《王者荣耀》猝不及防地升了一次级,多出了一个模块,名字就叫

挑战绝悟

 


 

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值