德州扑克人机大战,AI 有着压倒性优势,局势几乎不可逆转

德州扑克人机大战,AI 有着压倒性优势,局势几乎不可逆转

在德州扑克人机大战中,四位职业牌手与 CMU 开发的人工智能系统 Libratus 进行了激烈对抗。

Libratus是卡耐基梅隆大学的托马斯·桑德霍尔姆和诺姆·布朗(Noam Brown)开发的。他们以前开发的机器人 Claudico 在 2015 年的德州扑克比赛中没能击败职业牌手。

此前雷锋网(公众号:雷锋网)也曾报道过,“一对一无限注德州扑克”就是两个人玩的赌博游戏,因为事先会给每位玩家分发 2 张底牌,所以对方“底牌信息”你是不知道的,对于计算机来说,就是在处理一种“非完整信息博弈”。我们知道 AlphaGo 玩围棋,对弈双方的信息是完整的、对称的,并没有隐藏的信息。所以在德州扑克上AI取得了进步,是具有重要意义的。

比赛期间,前三轮比赛失利后,四位职业牌手在第四天和第六天的比赛中获得胜利。Libratus 原本领先193000 美元,在第六轮比赛后 Libratus 仅领先 51000美 元。

在人类选手反击迅猛之时,牌手之一詹森·莱斯便在一封电子邮件中写道:

我们花了一段时间学习,以理解正在发生的事情。

然而,随后 Libratus 的表现让所有非常人吃惊:再次获得关键性胜利。第 10 天结束时,Libratus 已经领先 677000 美元,而且局势也似乎不可逆转。

跟 AlphaGo 相似,Libratus 也可通过增强学习进行自我博弈和学习。

Libratus 的开发者之一托马斯·桑德霍尔姆也说道:

我们不能详细谈论 Libratus 的技术,直到比赛结束为止。但是,我可以告诉大家,Libratus 的算法一直在超级计算机上运行,所以超级计算机每天都在输出改进的策略。

今年 1 月底,Libratus 可能会在下一场比赛中再次击败人类。到目前为止,机器人还没有在无限制德州扑克团体赛中击败过人类,但这一天也许不会太远了。

人工智能扑克机器人的研发具有重大意义。首先,它是一种教导人工智能系统处理不完整信息的方式。诺姆·布朗指出“在现实世界中,所有的相关信息通常不像棋盘上的棋子那样明显。有些重要的信息会丢失或隐藏,人工智能需要能够处理这样的信息。”

本文作者:亚峰

本文转自雷锋网禁止二次转载,原文链接

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值