UCT-RAVE扑克中应用

     UCT-RAVE Algorithm Applied to Multi-player Games with Imperfect Information中关于扑克的中的一些描述,基本讨论UCT和RAVE的结合。一些方法在之前的论文中见到过,新意不大。但是有一点,其中提到了多次蒙特卡洛抽样来完成转换。原文如下:
     The combination of UCT-RAVE with Monte-Carlo sampling method embodies generation of perfect information situation in initialization course of searching. When UCTRAVE makes one search gap, first of all apply Monte-Carlo sampling to transfer imperfect information into perfect information situation then UCT-RAVE algorithm makes search of path and expansion of nodes as per the said situation. Next search shall base on another perfect information situation generated from Monte-Carlo sampling and nodes generated from all searches are kept in one search tree, the winning rate of every node in tree shall represent performance in average of all possible situations.
     具体也没什么实质性的东西,没提什么实践。类似迭代的思想,每一次更换ROOT节点,做多个非完美棋局的平均估值。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值