超越过去三年冠军,AAMAS2019 桥牌游戏论文揭秘

这篇论文介绍了使用深度学习构建桥牌叫牌系统,通过神经网络处理不完全信息,首次在该领域取得创新。研究者设计了紧凑的表示方法,并通过两个神经网络来处理未知牌信息,实验结果显示系统优于基于规则的叫牌方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

雷锋网 AI 科技评论按,近年来,AI 在博弈游戏中的研究成为研究者们关注的热点之一。2017 年,AlphaGo 成功击败人类最高围棋水平的代表柯洁,一度占据各大媒体的头条。之后,AlphaGo 不断进化,AlphaZero 轻松击败国际象棋和日本将棋并击败业内远超人类冠军水平的顶尖计算机程序。今年,OpenAI Five 击败 DOTA2 世界冠军 OG 团队。

而在今年 AAMAS 2019 的 140 篇入选论文中,我们注意到,其中有一篇关于不完全信息博弈游戏——桥牌游戏的论文——《Competitive Bridge Bidding with Deep Neural Networks》。该论文的作者是中科院计算所博士生荣江(现在阿里巴巴工作)、微软亚洲研究院资深研究员秦涛博士、新加坡南洋理工大学计算机科学与工程学院安波博士。

论文主要研究了在桥牌游戏中,基于神经网络构建叫牌系统的方法。

论文下载地址:https://arxiv.org/abs/1903.00900v2

论文的摘要如下:

超越过去三年冠军,AAMAS2019 桥牌游戏论文揭秘

雷锋网 AI 科技评论将摘要翻译如下:

桥牌游戏分为叫牌和打牌两个阶段。对计算机程序来说,虽然打牌相对容易,但叫牌是非常具有挑战性的。在叫牌阶段,每个玩家只知道自己牌,但同时,他需要在对手的干扰下与搭档交换信息。现有的解决完全信息博弈的方法不能直接应用于叫牌中。大多数桥牌程序都是基于人工设计的规则,但是,这些规则并不能覆盖所有的情况,而且,它们通常模棱两可甚至相互矛盾。本文首次提出了一种基于深度学习技术的叫牌系统,在文中,我们展示了两个创新点。首先,我们设计了一个紧凑的表示,对私人和公共信息进行编码,供玩家投标。第二,在分析其他玩家的未知牌对最终结果的影响的基础上,设计了两个神经网络来处理不完全信息,第一个神经网络推断出搭档的牌,第二个神经网络将第一个神经网络的输出作为其输入的一部分来选择叫牌。实验结果表明,我们的叫牌系统优于基于规则的最优方案。

桥牌游戏的研究背景是什么?有哪些难点?其现实意义是什么?本次论文的工作,用了哪些方法,遇到了什么困难?带着这些问题,雷锋网(公众号:雷锋网) AI 科技评论采访了论文的作者。以下是这次采访的主要内容。

问答记录:

AI 科技评论:你们着手桥牌游戏研究有多久了?训练数据源

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值