博弈论(本文主讲ICG博弈论)入门

注:本文所讲博弈论即为ICG博弈论,即只存在必胜和必败两种策略的博弈论(至于ICG是什么,下文会有介绍)。

一些fei话

今天刚学了博弈论,这东西在我今天学之前,我一直认为这是一个很高深的东西。听这名字——博弈论,就可以让人感受到一种高大上的感觉吧()。其实博弈论基础的东西并不是很多,虽然听起来也很高大上吧(),但是实际上还是很好理解的(我这么弱都说这东西好理解了,各位一定也能理解)。

博弈论

先来说一下什么是博弈论。博弈论,听名字就知道和博弈有关,那么博弈这个词是怎么定义的呢(玩过偏战术的游戏的人应该比较了解)?在百度百科中,博弈的本义是:在一定条件下,遵守一定的规则,一个或几个拥有绝对理性思维的人或团队,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。有时候也用作动词,特指对选择的行为或策略加以实施的过程。

同时博弈也有五大因素:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。(以上全部来自百度百科)

那么我们既然知道了什么是博弈,自然也能对博弈论有更深的了解:若干个人进行一些对弈,并且我们默认每个人都是最聪明的,不会失误,都可以找到当前的最优解,然后来寻找有没有哪个人有必胜/必败的的策略。

没错,归根到底,博弈论要做的事就是找出某个人必胜或者必败的策略(是胜和败,当然也存在平局的情况,不过本文是博弈论入门,所以涉及范围是些比较简单的ICG,自然只考虑必胜和必败)。由此可见,在每一场博弈中,博弈论显得极为重要。

我们可以把博弈论想象成一张有向无环图(注意,是有向无环图而不是树)。因此对于一场博弈,我们可以从一场博弈的第一步开始引出许多分叉,从而一步一步地推导出最后的必胜/必败策略。

 比如上面这张图,我们将最上面的节点0当做一场博弈的第一步,其他每个节点上的数字都是节点编号,那么我们可以从后往前推,一步步地递推推导出必胜的策略。因为对于一个必胜的策略,我们从获胜时的那一步(也就是最后一步)一步一步向前推,是无论如何都可以推到第一步的(我说的这些不是废话)。那么既然我们可以研究必胜的策略,自然也可以研究必败的策略,但是一场博弈只有必胜和必败之分,如果二者我们都研究的话,那么我们相当于把整张图都遍历了一遍,这样一来我们所研究的博弈还有什么意义呢?别急,这就要提一下博弈论的精髓所在了:

必胜是对于当前这个状态是必胜的,与是谁无关,赢的人只是处于一个胜的状态而已。

没错,博弈论的精髓就是这么一句话,这句话只有深刻理解了才能明白它的深邃之处,我在此不做赘述。

那么博弈论基本上到这里就结束了,接下来说一些博弈论研究范围内的东西。

NIM游戏

Nim游戏(又称 NIM博弈 )是博弈论中最经典的模型之一,它又有着十分简单的规则和无比优美的结论 Nim游戏是组合游戏( Combinatorial Games )的一种,准确来说,属于 “Impartial Combinatorial Games” (简称 ICG ,也就是公正的组合游戏)。在 NIM博弈 中,主要有三大因素(自己总结的):第一是先手与后手,第二是策略(即必胜或必败的策略),第三是局面(局面:把游戏过程中面临的状态称为局面)。

NIM博弈 不存在平局,只有必胜和必败两种策略。那么对于 NIM博弈 中的三个因素,因为必胜和必败是相对的,先手和后手也是相对的,所以我们考虑将二者结合从而去掉一维(简单的 NIM博弈  不需要考虑局面,相当于需要考虑的因素只有一维了),这样一来,我们的研究范围就缩减到了研究先手必胜先手必败两种情况。

先来举一个例子:某地流行着这样一个小游戏:摆出三堆硬币,分别包含3枚,5枚,7枚。两人轮流行动,每次可以任意选择一堆,从中取走任意多的硬币,可以把一堆取光但不能不取。取走最后一枚硬币的人胜利。由此我们可以推出NIM博弈的一般形式:给定 n 堆物品,第 i 堆物品有 a_{i} 个。两名玩家轮流行动,每次可以任选一堆,并从中取出任意多个物品,可以把一堆物品取光,但不能不取。取走最后一件物品的人获胜。两人都采取最优策略,问先手能否必胜。

先给出一个结论:NIM博弈 先手必胜,当且仅当 a_{1} xor a_{2} xor ... xor a_{n} \neq 0 时成立。

证明:

1. 如果先手面对的局面是a1⊕a2⊕…⊕an≠0,

那么先手总可以通过拿走某一堆若干个石子,将局面变成a1⊕a2⊕…⊕an=0。如此重复,最后一定是后手面临最终没有石子可拿的状态。先手必胜。

2. 如果先手面对的局面是a1⊕a2⊕…⊕an=0,

那么无论先手怎么拿,都会将局面变成a1⊕a2⊕…⊕an≠0,那么后手总可以通过拿走某一堆若干个石子,将局面变成a1⊕a2⊕…⊕an=0。

如此重复,最后一定是先手面临最终没有石子可拿的状态。先手必败。

ICG

ICG ,即公平组合游戏。

若一个游戏满足:

1.两名玩家交替行动。

2.在游戏进行的任意时刻,可以执行的合法行动与轮到哪名玩家无关。

3.不能行动的玩家判负。

满足以上三个条件的游戏即可成为 ICG 。但是常见的棋类游戏,如五子棋、围棋等,都不属于ICG,因为它们不满足条件2和条件3。

有向图游戏

给定一个有向无环图,图中有唯一一个起点,在起点上放有一枚棋子。两名玩家交替把这,这枚棋子沿邮箱变进行移动,,每次可以移动一步,无法移动者判负。该游戏称为有向图游戏

任何一个ICG都可以转化为有向图游戏。具体方法是:把每个局面都看做图中的一个节点,并且从每个局面向沿着合法行动能够到达的下一个局面连有向边。

Mex运算

设 S 表示一个非负整数集合。定义 mex(S) 为求出不属于集合S的最小非负整数的运算。(L阿特X打起来特别麻烦,由于我太懒所以就不打了)。

SG函数

在有向图游戏中,对于每个节点 x ,设从 x 出发共有 k 条有向边,分别到达节点y1 , y2 , ... ,yk 的 SG函数值构成的集合再执行 mex 运算的结果。

特别地,整个有向图游戏 G 的 SG函数值被定义为有向图游戏起点 s 的 SG函数值,即 SG(G) =  SG(s) 。

最后

以上就是博弈论入门的所有内容了,博弈论相关题目的代码都非常的好写,一般都是比较考验思维的题目,所以代码也没什么可讲的,分析完题目后直接运用相关定理即可。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值