关于麻将信息集公式的推导,具体解释详细的推导过程

关于麻将信息集公式的推导,具体解释详细的推导过程

GPT-4o

Poe

要理解并推导麻将信息集公式 I 的构造,我们需要仔细分析麻将的规则和状态空间的定义。以下是详细的推导过程:


1. 公式的含义与背景

在麻将中,信息集指的是游戏过程中所有可能的状态集合,包括玩家的手牌、公共牌池、未知牌的分布等所有信息。麻将的复杂性来源于隐藏信息(其他玩家的手牌和牌山中的牌),因此信息集是个非常庞大的集合。

公式:

I=C13613×(1+344+⋯+3480)×73

I = C_{136}^{13} \times \left(1 + 34^4 + \cdots + 34^{80}\right) \times 7^3

I=C13613​×(1+344+⋯+3480)×73

公式分为以下几个部分,分别表示:

  1. 玩家手牌的组合数:从136张牌中抽取13张。
  2. 可能的隐藏牌分布牌山(剩余牌)的排列组合,考虑到每张牌的种类。
  3. 玩家的行动序列:包括打牌、吃牌、碰牌等操作的可能性。

我们逐步解释每一部分的来源和推导。


2. 玩家手牌的组合数

(1) 从136张牌中抽取13张

每个玩家在开始时有13张手牌,这些牌从136张牌的牌堆中抽取。抽取的组合数用组合公式表示为:

C13613=136!13!⋅(136−13)!

C_{136}^{13} = \frac{136!}{13! \cdot (136-13)!}C13613​=13!⋅(136−13)!136!​

这个数值表示所有可能的13张手牌组合,是整个信息集计算的第一步。

(2) 为什么不考虑顺序?

麻将中,手牌的排列顺序不影响游戏规则,因此我们只关心哪13张牌被抽到,而不关心这些牌的顺序。因此选择用组合(而非排列)来计算手牌的可能性。


3. 隐藏牌的排列组合

麻将有34种牌型(1万到9万,1条到9条,1筒到9筒,以及东南西北中发白),每种牌有4张,总计136张牌。游戏过程中,除了玩家的手牌,剩下的牌(称为牌山)是隐藏的,牌山的排列和分布构成了信息集的重要部分。

(1) 剩余牌的分布
  • 假设玩家的手牌已经确定,那么剩下的牌可以有不同的排列方式。
  • 由于麻将的每种牌最多出现4次,可以用34种牌的分布来描述牌山。例如:
    • 如果1万出现了2次,2万出现了1次,3万出现了3次,依此类推。
(2) 隐藏牌的分布公式

隐藏牌的分布可以用指数的形式表示。假设每种牌的分布次数可以从0到4(每种牌最多有4张),则所有可能的分布组合数为:

1+344+348+⋯+3480

1 + 34^4 + 34^8 + \cdots + 34^{80}

1+344+348+⋯+3480

  • 解释每一项:
    • 34^4 表示所有牌型都只出现4张的情况。
    • 34^8 表示所有牌型出现不同次数(例如一些牌型只出现3张)的情况。
    • 34^{80} 是一种极端情况,描述所有牌型的复杂排列
(3) 为什么是累加?

在实际游戏中,不同的牌型分布对信息集的复杂性有不同的贡献,因此需要计算所有可能的牌型分布组合数,并累加起来。


4. 玩家行动序列

麻将的行动序列是游戏复杂性的重要来源之一。每个玩家在轮到自己时有可能执行以下操作:

  • 打出一张牌。
  • 吃牌、碰牌、杠牌等。
  • 根据手牌和规则决定不同的策略。
(1) 每位玩家的行动选择数

假设每位玩家的行动空间有 7种可能性(如打牌、吃牌、碰牌等),且行动的组合数可以表示为 737^373。这是因为:

  • 3 是玩家数量减1(即其他3名玩家可能的行动)。
  • 7 是行动的可能性。
(2) 为什么是乘法?

每位玩家的行动序列相互独立,因此需要将每位玩家的可能性相乘,最终得到所有可能的行动序列。


5. 整体公式的推导

将上述每一部分综合起来,麻将的总信息集公式为:

I=C13613×(1+344+348+⋯+3480)×73

I = C_{136}^{13} \times \left(1 + 34^4 + 34^8 + \cdots + 34^{80}\right) \times 7^3

I=C13613​×(1+344+348+⋯+3480)×73

(1) 含义分解:
  • C13613C_{136}^{13}C13613​:表示玩家手牌的组合数。
  • (1+344+⋯+3480)(1 + 34^4 + \cdots + 34^{80})(1+344+⋯+3480):表示隐藏牌(牌山)的分布组合数。
  • 737^373:表示所有玩家行动序列的可能性。
(2) 数值近似:
  • C13613≈1.21×1023C_{136}^{13} \approx 1.21 \times 10^{23}C13613​≈1.21×1023
  • (1+344+⋯+3480)≈10117(1 + 34^4 + \cdots + 34^{80}) \approx 10^{117}(1+344+⋯+3480)≈10117
  • 73=3437^3 = 34373=343

最终计算结果为:

I≈5.48×10142I \approx 5.48 \times 10^{142}I≈5.48×10142

这个值表示麻将游戏的完整信息集的规模,是一个非常庞大的数值,说明麻将的复杂性极高。


6. 总结

麻将信息集公式的推导表明:

  1. 手牌组合数 C13613C_{136}^{13}C13613​ 是信息集的基础。
  2. 隐藏牌的分布 是麻将复杂性的主要来源,用 1+344+⋯+34801 + 34^4 + \cdots + 34^{80}1+344+⋯+3480 表示。
  3. 玩家的行动序列 用 737^373 表示可能的决策路径。
  4. 最终的规模是 5.48×101425.48 \times 10^{142}5.48×10142,反映了麻将作为博弈的极高复杂性。

理解这一公式,有助于我们深入认识麻将作为一个博弈问题的数学结构和挑战。

为什么每位玩家的行动空间有 7种可能性

GPT-4o

Poe

在麻将中,玩家的行动空间是指每位玩家在轮到自己时,根据当前的牌局状态和规则可以做出的所有合法选择。具体到公式中提到的 "每位玩家的行动空间有 7 种可能性",这是对麻将实际规则的一种简化建模。

以下是详细解释:


1. 玩家在麻将中的常见行动

麻将的规则决定了玩家在每个回合可能执行的几种主要操作。通常,这些行动包括:

  1. 摸牌:从牌山中摸一张牌(如果是自己的回合)。
  2. 打牌:将手牌中的一张牌打出。
  3. 吃牌:如果上家打出的牌满足条件,可以用自己的手牌组成顺子(如4万345万)。
  4. 碰牌:如果另一玩家打出的牌能组成刻子(如已有两张5筒,对方打出5筒),可以碰。
  5. 杠牌:如果手中有三张相同的牌,或者碰之后又摸到第四张相同的牌,可以杠。
  6. 胡牌:如果手牌满足胡牌条件,可以选择胡牌。
  7. 过(跳过行动):放弃当前可以执行的操作(比如不吃、不碰、不胡)。

因此,总共可以归纳为 7 种主要行动:

  • 摸牌
  • 打牌
  • 吃牌
  • 碰牌
  • 杠牌
  • 胡牌

2. 为什么选择 7 种可能性?

(1) 麻将规则的建模简化

在实际麻将游戏中,玩家的行动可能受到具体局势的限制。例如,在某些情况下:

  • 可能没有牌可以吃、碰或杠。
  • 可能还未达到听牌状态,无法胡牌。

但是,在计算信息集时,我们需要考虑理论上的所有可能性,即在任何一个回合中,玩家可能有的完整选择集合。因此,这里将所有可能的行动笼统地归纳为 7 种。

(2) 动作的独立性

虽然某些行动在实际游戏中不会同时发生(例如,摸牌和吃牌是互斥的),但在信息集的计算中,我们将这些动作视为独立的可能操作,以便涵盖所有情况。这种建模方式便于计算操作路径的复杂性。

(3) 简化分析的需要

麻将的实际行动空间可能比 7 种更复杂,比如:

  • 打牌时有 13 张不同的手牌可以选择。
  • 吃牌可能有多个组合(如4万可以接345万234万)。
  • 杠牌可能有暗杠、明杠的区分。

然而,在信息集公式的推导中,为了简化分析,我们不细分具体动作的细节,而是将所有可能的选择抽象为 7 个“主要类别”。


3. 适用于所有玩家的行动空间

麻将是一个四人游戏,当轮到一个玩家时,其行动选择不仅影响自己的状态,还会影响其他玩家的选择。因此,将每位玩家的行动空间归纳为 7 种操作,可以很好地描述整个游戏的动态变化。

在公式中,信息集的行动部分写作:

737^373

这表示:

  • 假设当前玩家的行动有 7 种选择。
  • 其余 3 名玩家的行动依赖于当前玩家的行为,每人也有 7 种可能性。
  • 总的行动组合数为 73=3437^3 = 34373=343。

4. 为什么不将行动细化更多?

细化玩家的行动空间会显著增加计算复杂性。例如:

  • 打牌时的选择:一个玩家可能有 13 张手牌,每张牌都可以打出,理论上有 13 种选择。
  • 吃牌的选择:如果有多个吃法(如4万可以接345万234万),需要分别计算。
  • 杠牌的选择:明杠和暗杠的不同情况也需要分别考虑。

如果将这些细节都纳入计算,信息集的公式将变得极为庞大且难以解析。因此,为了简化推导和表示,公式中只关注每位玩家的“操作类型”,并将其归为 7 类。


5. 总结

麻将中的 "每位玩家的行动空间有 7 种可能性" 是一种简化建模,归纳了麻将游戏中所有可能的行动类型,包括:

  1. 摸牌
  2. 打牌
  3. 吃牌
  4. 碰牌
  5. 杠牌
  6. 胡牌

虽然实际游戏中可能并不是每种行动都随时可行,但在信息集公式的推导中,我们需要计算所有理论上的可能性,因此统一考虑 7 种行动类别。这种简化方法既能全面涵盖麻将的动态变化,又便于公式的计算和分析。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

强化学习曾小健

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值