AI「赌王」问世!

ced59b419c0d768986d493e6d715dab3.png


  视学算法报道  

编辑:袁榭

【新智元导读】2022年3月25日,法国初创公司NukkAI举办的桥牌挑战赛中,其桥牌AI获胜的次数多过人类选手,把人类比下去了。

AI下棋能把人类顶尖选手下到哭、玩星际争霸能赢世界冠军。

现在,连人类智力游戏最后的高地-桥牌,AI也能占领了么?这……倒真不一定。

ebf37c96223e54f807532ae6ef76c666.png

桥牌AI胜率83%,超过人类冠军

据英国《卫报》报道,AI近日在桥牌比赛中击败了八位世界冠军。直到当时,在这种游戏中,人类一直保持着至高无上的赢家地位,机器的挑战总被击败。

这场胜利代表了AI业的一个新里程碑,因为在玩桥牌时,玩家得依靠不完整的信息做出决策,并且必须对其他多名玩家的行为做出反应。这种状况更接近于人类的决策环境。

相比之下,人工智能击败人类冠军的国际象棋和围棋,玩家每次比赛只有单个对手,并且两者都拥有盘面上的全部信息。

伦敦帝国理工学院机器学习教授Stephen Muggleton因此称:「我们当下所见,代表了AI系统状态的根本性重要进步。」

65e6777a208dee8275d389a1f26acc76.png

2022年3月25日,法国初创公司NukkAI在巴黎举行的为期两天的挑战赛结束时宣布了其AI获胜的消息。

NukkAI举办的挑战赛中,要求人类冠军连玩800张牌,分为每次发牌10张的80次竞赛对决。

这种赛制去除了桥牌游戏本有的初始叫牌部分。

每个人类冠军都用自己和他们的虚拟「明手」搭档的牌对抗一对桥牌机器人程序。

这些打牌bot是迄今为止世界上最强的牌类bot,打遍机器人界无敌手,但对决人类顶尖选手时还是输多赢少。

NukkAI开发的桥牌AI叫做NooK,在赛制中被安排在和人类冠军一模一样的角色位置,对手bot、牌面牌色完全相同。

最后比较AI和人类冠军谁赢的平均次数更多,谁就是最后的胜出者。

fd5a95831bcf345702c9544d9405f209.png

最后NooK赢得了80次中的67次,以83%的优胜率赛过人类冠军,成为最后赢家。

NukkAI的联合创始人Jean-Baptiste Fantun表示,他一直相信该公司已经开发了5年的AI能在发牌数好几千的此类赛制中获胜,但这次的发牌数只有800。

宣布结果时,2010年菲尔兹奖得主、数学家Cédric Villani称NukkAI是「一个极好的法国创业成功故事」。

决策可被解释的「白盒」AI

NukkAI的另一位联合创始人、人工智能研究员Véronique Ventos称 NooK 为「新一代人工智能」,因为它的决策可被解释。

她说:「在桥牌中,如果你无法解释自己的决策,就很难真正玩下去」。因为完全的桥牌赛程必须依赖于合作伙伴之间的沟通。

可解释性是AI领域的热门话题。Muggleton表示:「近年来,公众所听到的关于机器学习的大部分成就,都是基于AlphaGo等黑盒系统,它无法向人类解释自己如何做出决策。 」

相反,NooK代表了一种「白盒」或「神经符号」方法。 它不是通过玩数十亿次游戏试错来习得玩法,而是首先学习游戏规则,然后再通过练习改进技能。 NooK是基于规则和深度学习系统的混合体,这种学习方式更近于人类。

e5fa5169ec71c7025d82c82df4f8dd9f.gif

美国罗德岛布朗大学计算机科学教授Michael Littman说:「业界的钟摆正朝着这些方式的方向摆动。无法解释事件何以发生的智能体,在以后的社会中是行不通的。」

Littman说,即使一个人或AI无法用语言表述他们在做什么,他们的行为也需要让其他智能体「清晰易懂」、行事准则得是共通且可理解的。

这在医疗和工程等领域至关重要。 例如,未来自动驾驶汽车们在通过路口或变线抢道时,需要能够读取彼此的行为。

英国多次世界桥牌冠军、NooK的本次挑战者之一Nevena Senior称NooK的发明者们完成了一项「了不起的」工作。 她发现这款AI比人类更能读懂对手,更能利用他们的错误。 「这是人类在获得足够经验后才会做的事情,我很惊喜地发现AI模仿了典型的人类技能。」

赢了,但没完全赢:桥牌AI竟然不会叫牌

Littman教授对本次桥牌挑战不包括叫牌感到失望,这是桥牌过程中的沟通和欺骗所在的最有趣部分。

但Nevena Senior表示,人类和NooK拿到的发牌牌色变数很大,以至于没有叫牌的打牌过程也同样丰富。

不过不止教授失望,广大网友也纷纷表示,没有叫牌,算什么AI在桥牌上战胜人类。

叫牌这个步骤,是桥牌中最具人类决策性质的,AI现在仍然无法复刻。光靠发牌的变量不能完全替代叫牌。

fa0124db2e410359c23e551636879667.png

桥牌,全称合约桥牌,是两对双人搭档对峙的四人纸牌游戏。

双方需要在叫牌过程中互相竞争,确定「定约」。然后在打牌的时候,通过与队友的默契配合,获得「定约」目标的「墩数」,才算获胜。

对于AI来说,围棋与桥牌、或者说弈与博,在博弈计算中的根本区别,在于棋是完全信息动态博弈,而牌属于非完全信息动态博弈。

970fc0c989c38e45b5893fe6a70593e4.png

棋类竞赛中,对峙双方所掌握的局势信息是公开的、对称的,盘面一望即知、无遮无拦,AI只需要处理公开的完全局势数据。

而桥牌中,单个玩家开始时拿到的一手牌,得到的信息只是一副牌的四分之一,是不完整的。

在叫牌阶段,每个玩家需要在对手的干扰下与搭档交换自己的牌面信息、并干扰对手获得牌面信息。

通过叫牌,玩家能知道一部分同伴和对手的牌面信息,然后需要对不明情况进行猜测、判断和分析。

到了打牌阶段,作为牌搭子的两名玩家可以看到两家「明手」的牌面,也就是一副牌的二分之一,依然是不完整信息。

随着牌局的进行,隐藏手牌代表的未知信息越来越少,直到最后一轮牌打完,盘面才清晰。

所以桥牌的叫牌,是实行牌搭子间合作、对手间欺敌、体现和利用决策环境迷雾的关键步骤。

所以这次大家的反应才会如此:AI不会叫牌,算什么战胜人类呢。

448014a62630d9116ecf72d947a47147.gif

不过,现实世界中大部分人类的互动都是同时存在合作与竞争,而且行为体都依据非公开、不完整的私有信息进行决策,同时不乏欺诈、伪饰、误导等干扰性操作。

如果AI真能在完整的桥牌游戏中胜过人类,那么真的代替人类进行决策、甚至成为「通用人工智能」(AGI),似乎也不再是梦想了。

参考资料:

https://www.theguardian.com/technology/2022/mar/29/artificial-intelligence-beats-eight-world-champions-at-bridge
https://www.springerprofessional.de/en/the-search-algorithm-for-the-game-of-bridge/19762716
https://www.youtube.com/watch?v=DHpeHCsojbI
https://twitter.com/nukkailab1

7163143affc9d946a24a704354e18e43.png

outside_default.png

点个在看 paper不断!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值