基于卷积神经网络的“拱猪”博弈算法

摘要: “拱猪”又称“华牌”,是一款极具特点的牌类游戏,属于非完备信息博弈,由亮牌和出牌2个阶段组成,整个游戏过程具有极强的反转性。为了研究“拱猪”计算机博弈算法,本文提出了一种基于深度学习的“拱猪”博弈算法,包含亮牌和出牌2个神经网络,分别用于亮牌和出牌阶段。亮牌和出牌网络均采用卷积神经网络(convolutional neural network,CNN)来构建,根据功能特点分别设计为不同的网络结构。采用11000局人类高级玩家的真实牌谱按比例生成训练数据和测试数据,对2个CNN网络进行了训练、测试和分析。结果表明,亮牌和出牌网络分别达到了88.4%和71.4%的准确率。对亮牌和出牌的一些具体例子进行的分析表明,本文算法能够产生合理的亮牌和出牌策略。

  • 关键词: 
  • 人工智能  /  
  • 非完备信息博弈  /  
  • 深度学习  /  
  • 卷积神经网络  /  
  • 拱猪  /  
  • 华牌  /  
  • 亮牌  /  
  • 出牌  

非完备信息博弈是指参与者无法从游戏对局中获得所有的局面信息,因此对其博弈算法研究具有一定的难度,目前已备受关注,成为热门研究之一。德州扑克[1-3]、“斗地主”[4-5]等,尤其是德州扑克的国内外相关研究成果较多。2013年,王轩等[6-10]在信息表示、函数优化、博弈树搜索 、对手建模和风险模型分析等方面取得的成果显著,并在2013年世界计算机扑克大赛(annual computer poker competition, ACPC)2人限注项目竞赛中,取得了第4名的好成绩[11]。2015

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

宋罗世家技术屋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值