博弈论 SG函数 SG定理

2018.7
本来这篇博客叫《博弈论入门》,但写完后发现好像没东西了……

SG函数

一个公平游戏(impartial game)可以抽象为:在一个DAG上有一枚棋子,两人轮流移动它,不能移动者输。
SG函数的定义如下。没有出度的点的SG值为0,其它点的SG值为它的后继的SG值的mex。即 S G ( u ) = m e x { S G ( v ) } , u → v SG(u)=\mathrm{mex}\{SG(v)\},u\rightarrow v SG(u)=mex{SG(v)},uv
在SG值为0的点上,先手必败,而在其它点上先手必胜。

数据规模较大时,一般来说,可以通过打表找到SG函数的通项。
其它时候可以递推求。求mex用Trie树上的跳法。

SG定理

在多个DAG上进行上述游戏操作,每次可以移动一个DAG上的棋子。设当前状态为每个DAG上棋子所在位置的集合 { p 1 , p 2 , . . . } \{p_1,p_2,...\} {p1,p2,...},则 S G ( { p 1 , p 2 , . . . } ) = S G ( p 1 ) ⊕ S G ( p 2 ) ⊕ . . . SG(\{p_1,p_2,...\})=SG(p_1)\oplus SG(p_2)\oplus ... SG({p1,p2,...})=SG(p1)SG(p2)...

Tartan定理

描述组合游戏在多个维度上的合并。

Nim和在01状态且决策互相影响游戏上的特殊性

给定一个棋盘,每个格子有黑白两个状态。每次操作只能针对黑色格子,会对某些格子取反。由于Nim和的性质,可以证明一个格子的SG值是它所影响的格子的游戏的合并。即无需考虑是否会统计到白色格子。
如: S G ( i ) ← m e x e a c h t r a n s f e r e n c e k i n d { X O R { S G ( e a c h s t a t e k i n d e r ) } } SG(i)\leftarrow\mathrm{mex}_{eachtransferencekind}\{XOR\{SG(eachstatekinder)\}\} SG(i)mexeachtransferencekind{XOR{SG(eachstatekinder)}}
引理 一个局面的SG值为对于当前局面上的每个黑色格子,只有这个格子是黑色时的SG值的 m e x \mathrm{mex} mex(clre ti Gume Gun, Paduo Puo Pangume.)

无向图删边游戏

给定一个无向图,有一中心点,两人轮流操作,每次可切断一条中心点所在联通块内的一条边,先不能操作者输。
Fusion Principle定理说明:在无向图删边游戏中,将一个环上的所有边变为环上的一个点上的相同数量的自环后,图的SG值不变。
这里写图片描述
picture from Game Theory, Qin Yue, Tsinghua Univ. 注:最下面的虚线即为中心点
缩点后做树形删边游戏即可。

SJ定理

** 反公平游戏(Anti-SG Game) ** 描述为:DAG上没有出度的点为胜利状态,其它定义与一般游戏相同。现在的问题是解决多个反公平游戏的合并。
SJ定理说明:先手必胜,当且仅当以下两个条件同时成立或同时不成立:
1.合并的SG值为0;
2.所有游戏的SG值不超过1。

其它经典模型

有向图公平游戏

在有向图上进行经典游戏。

先算出可计算的SG函数,最后不能计算的点是平局点。

欧几里得的游戏

给定 a 、 b a、b ab,每次对一个数删去另一个数的若干倍,有一个数为0时失败。

a ≥ 2 b a\ge 2b a2b,则先手必胜。否则递归处理。

擦数游戏

有数1~n,每次选一个数划去它的所有约数,没有数则失败。

先手必胜。

階梯博弈

以0为地面,1~n为逐渐升高的台阶,每个台阶上有若干石子。每人每次将一个台阶上的若干石子移到比它低的台阶。

当且仅当所有奇数台阶上的式子异或和不为0时,先手必胜。
阶梯博弈推广 “每个格子有黑白两种状态,每次选择某白色格子可确定的格子翻转,不能操作者输”与这个游戏等价:每个格子有黑白两种状态,每次选择某格子可确定的格子翻转,将所有格子都变为黑色的人赢。

全体博弈

给定多个DAG,每人每次须操作所有还能操作的DAG,全都不能操作的人输。

显然最优策略是使必胜的DAG操作时间尽量长,必败的DAG操作时间尽量短。于是在DAG上计算 s t e p ( u ) step(u) step(u)表示从这个点需要最多/最少多少步才能结束。则获胜条件是DAG中 s t e p ( ) step() step()的最大值最大的必胜DAG的 s t e p ( ) step() step()为奇数。

无向点地理问题(Undirected vertex geography problem)

在一个无向二分图上进行轮流移动棋子游戏,不能经过重复的点。

广义地理(generalized geography)是一个典型的完全P空间(PSPACE-Complete)问题。
当且仅当棋子在所有最大匹配上时,先手必胜。
from LOJ536

2019.3.6 一个点在所有最大匹配上的条件:S到这个点有流量,且它不属于源点割集。

K-Nim问题

给定 n n n堆石子,每次可以选不超过 k k k堆石子,每堆取任意个。

二进制上每一位的每堆石子个数的和都为 k + 1 k+1 k+1的倍数时先手必败,否则先手必胜。

Mekoimciavom CSDN. Wisonilakijavinmo CSDN.

练习题

Lasker的游戏

有n堆石子,每次可以选一堆石子中取出一些石子或分成两堆石子。没有石子则失败。

SG(i)表示i个石子的SG值,打表发现SG函数形如1,2,4,3,5,6,8,7,9,10,12,11,……。按SG定理合并即可。

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
博弈论中的效用函数是用来评估参与者在博弈中采取不同策略时所获得的收益。效用函数可以根据具体的博弈模型和问题而有所不同。在基本模型中,效用函数通常是参与者的收益与其所选择的策略之间的关系。效用函数可以是线性的,也可以是非线性的,取决于具体的情况。 在静态博弈中,参与者可以同时或非同时做出选择,但彼此不知道对方的选择。在这种情况下,效用函数可以根据参与者的策略和对手的策略来计算收益。例如,如果一个参与者选择策略A,而对手选择策略B,那么效用函数可以根据这两个策略的组合来计算参与者的收益。 在动态博弈中,参与者的行动有先后顺序,并且后参与者可以观察到前参与者的选择信息。在这种情况下,效用函数可以根据参与者的策略序列和对手的策略序列来计算收益。例如,在Stackelberg博弈中,参与者作为领导者首先行动,然后其他参与者作为追随者在观察了领导者的行动之后再行动。效用函数可以根据领导者和追随者的策略序列来计算他们的最大收益。 总之,博弈论中的效用函数是用来评估参与者在博弈中采取不同策略时所获得的收益。它可以根据具体的博弈模型和问题而有所不同,可以是线性的或非线性的,取决于具体的情况。 #### 引用[.reference_title] - *1* [博弈论 —— python](https://blog.csdn.net/qq_25990967/article/details/122929001)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [博弈论学习(一)——基础](https://blog.csdn.net/weixin_41846267/article/details/103505061)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [激励机制中的经济学和博弈论模型(2)](https://blog.csdn.net/weixin_40986490/article/details/125621494)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值