机器博弈游戏规则 德扑和德扑变种

术语

raise:也就是加注,就是当前决策玩家不仅将下注总额保持一致,还额外多加钱。(比如池中玩家一共100,玩家二50,玩家二现在决定raise,下100。此时池中玩家一共100,玩家二150。)
call:也就是跟注或者pass,即当前决策玩家决定下注总额保持和另一个玩家一致。(情景一:如果德扑第二三四轮第一个执行动作的玩家决定call,那它就不往池中加钱,将决策转移给另一个玩家,如果另一个玩家也call,则直接进入下一轮。情景二:如果现在池中玩家一100,玩家二50,玩家二决定call,则玩家二下50,此时二人池中总金额一致。此时将进入下一轮)
fold:也就是弃牌,即当前决策玩家决定不玩了,池中的钱全不要了,结果该局。注意:有些代码设置每轮第一个执行动作的玩家不能fold,我觉得是因为第一个执行动作的玩家没必要fold,他完全可以call一下,等需要加钱的时候再决定要不要false。
all-in:全下,即当前玩家将自己所有Money全部投入池中。此后的环节他就不用执行动作,只需要等到最最后和所有玩家一起将自己的两张私人牌公布然后比大小。此时其他玩家赌注的大小可以是当前玩家池中剩余筹码的任意整数,只要不小于本轮最后一次赌注或big blind(见下)。

HULH:(heads-up limit Texas hold’em)

有限注德扑:一共有52张牌(四种花色的1-K),两个玩家。游戏共四轮。
游戏开始时,玩家一(庄家)下注(small blind)¥50,玩家二下注(big blind)¥100。第一轮( pre-flop)每人发两张牌,玩家一先做决定。第二轮(flop)在桌面放三张公共牌,玩家一先做决定。第三轮(turn)桌面放一张,玩家二先做决定。第四轮(river)桌面放一张,玩家二先做决定。一二轮最多加注3次,三四轮最多加注4次。
HULH:1017 nodes and over 1014 infosets。

FHP:flflop hold’em poker

FHP:只有前两轮的简易德扑:第一轮每个玩家发两张牌,第二轮桌面发三公共牌。
FHP:has 1012 nodes and over 109 infosets.

NLLH (No-Limit Leduc Hold’em )

简化版无限制德扑游戏:一共有6张牌,一般为两个J,两个Q和两个K。两个玩家。游戏共有两轮。
第一轮给每个玩家发1张牌,第二轮桌面发1张公共牌,玩家可以将任意数量的筹码下注到该玩家剩余筹码的最大值。在每一轮投注中也不限制加注或下注的次数。做训练可设置最大筹码为5,10,15。
最大筹码为15的NLLH: has over 2×107 states and 3.7 × 106 information sets。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值