九坤德州扑克第一名方案分享

本文分享了作者在九坤投资举办的德州扑克AI比赛中荣获第一的策略。策略主要基于蒙特卡洛模拟计算胜率,结合赔率和加注量决策是否加注、跟注或弃牌。在决赛中,根据对手行为动态调整策略,增加胜率。此外,还探讨了未来可能的改进方向,如剔除对手不会跟进的手牌类型、考虑不同位置的打法和应用强化学习。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 前言

本人在于4月22号在量化投资公众号上看到了九坤投资举办的比赛,抱着拿个offer的心态参加了第三届第三期的德州扑克AI对抗赛,并侥幸获得第一名(运气还是占了比较大的成分),现分享自己的方案。
比赛链接为:比赛链接

2 德州扑克规则

这里简单介绍一下德扑规则。一开始每人都会有自己的两张起手牌(只有自己能看见),第一轮会出现三张公共牌,第二轮发第四张,第三轮发第五张。每一轮都可以根据自己的牌型选择下注,跟注,加注,弃牌。在最后一轮结束时如果还有两位以上的选手在场需要翻出手牌比大小。

3 方案介绍

3.1 方案简介

本人采取的方案主要是通过计算目前的胜率和下注的赔率综合决策的。

3.2 胜率计算

对于每轮自己的胜率计算,我是采用蒙特卡洛模拟方法去模拟未来的公共牌和对手的手牌来计算的。这里计算胜率只考虑一个对手,对于场上存在多个对手时,胜率计算可以累乘。比如通过模拟得到的胜率是0.8,场上剩下3人,那么你的胜率就是0.8*0.8=0.64。后面我发现如果这么计算的话会导致自己入场的次数很少,盈利能力变弱,决赛我计算最终的胜率仅考虑场上只有两个人

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值