博弈故事一则——海盗分金币问题

  话说一天有5个海盗抢了一艘who的游轮,抢到了100枚金币,但这5个人没有老大,不知道怎么分这100枚金币。不过5个人都绝顶聪明,他们决定:1,抽签,决定12345五个号码,2,由1号提分配方案,大家一起举手表决,超过半数同意则通过;否则被扔进大海里喂鲨鱼;3,1号死了由2号提分配方案,四个人表决有超过半数人同意,则通过,否则仍旧被扔进大海里喂鲨鱼;4,以此类推-----

 

  假定:每个海盗都是一样的聪明,没有谁比谁笨,都很理智可以 做出理性的决策,那么1号如何决策才能使自己的收益最大且当然不会被扔进大海里喂鲨鱼?

 

  答案分析: 1号海盗分给3号1枚金币,4号或5号2枚金币,自己则独得97枚金币,即分配方案为(97,0,1,2,0)或(97,0,1,0,2)。

 

现来看如下各人的理性分析:


    首先从5号海盗开始,因为他是最安全的,没有被扔下大海的风险,因此他的策略也最为简单,即最好前面的人全都死光光,那么他就可以独得这100枚金币了。

    接下来看4号,他的生存机会完全取决于前面还有人存活着,因为如果1号到3号的海盗全都喂了鲨鱼,那么在只剩4号与5号的情况下,不管4号提出怎样的分配方案,5号一定都会投反对票来让4号去喂鲨鱼,以独吞全部的金币。哪怕4号为了保命而讨好5号,提出(0,100)这样的方案让5号独占金币,但是5号还有可能觉得留着4号有危险,而投票反对以让其喂鲨鱼。因此理性的4号是不应该冒这样的风险,把存活的希望寄托在5号的随机选择上的,他惟有支持3号才能绝对保证自身的性命。
    再来看3号,他经过上述的逻辑推理之后,就会提出(100,0,0)这样的分配方案,因为他知道4号哪怕一无所获,也还是会无条件的支持他而投赞成票的,那么再加上自己的1票就可以使他稳获这100金币了。
    但是,2号也经过推理得知了3号的分配方案,那么他就会提出(98,0,1,1)的方案。因为这个方案相对于3号的分配方案,4号和5号至少可以获得1枚金币,理性的4号和5号自然会觉得此方案对他们来说更有利而支持2号,不希望2号出局而由3号来进行分配。这样,2号就可以屁颠屁颠的拿走98枚金币了。
          不幸的是,1号海盗更不是省油的灯,经过一番推理之后也洞悉了2号的分配方案。他将采取的策略是放弃2号,而给3号1枚金币,同时给4号或5号2枚金币,即提出(97,0,1,2,0)或(97,0,1,0,2)的分配方案。由于1号的分配方案对于3号与4号或5号来说,相比2号的方案可以获得更多的利益,那么他们将会投票支持1号,再加上1号自身的1票,97枚金币就可轻松落入1号的腰包了。
   看到这里,读者一定会问,这个海盗分金币的题目与中国说“不”有何关联呢?好,下面就切入正题。
海盗分金币模型的最终答案可能会出乎很多人的意料,因为从直觉来看,此模型中如此严酷的规定,若谁抽到1号真是天底下最不幸的人了。因为作为第一个提出方案的人,其存活的机会真是微乎其微,即使他一个金币也不要,都无私的分给其他4个人,那4个人也很可能因为觉得他的分配不公而反对他的方案,那他也就只有死路一条了。可是看起来处境最凶险的1号,却凭借着其超强的智慧和先发的优势,不但消除了喂鲨鱼的危险,而且最终还使自己的收益最大化。

 

田忌赛马问题可以用矩阵博弈的方式来求解。假设田忌和齐王各有n匹马,马的速度不一样,田忌和齐王都知道各自马的速度,但不知道对方马的速度。现在要进行一场比赛,规则是田忌和齐王每次各选出一匹马进行比赛,速度快的获胜。每场比赛赢一分,平局不得分,输了不得分。比赛进行n场,求田忌最多能得多少分。 矩阵博弈的思路是构造一个n*n的矩阵,第i行第j列表示田忌用第i匹马与齐王用第j匹马比赛的得分。例如,第一行表示田忌用自己最快的马与齐王用不同的马比赛的得分,第二行表示田忌用自己第二快的马与齐王用不同的马比赛的得分,以此类推。 根据题意,构造比赛得分矩阵的方法如下: 1. 田忌用最快的马与齐王用最慢的马比赛,得分为1; 2. 田忌用第二快的马与齐王用第二慢的马比赛,得分为1; 3. 田忌用最慢的马与齐王用最快的马比赛,得分为0或-1。 注意,第三种情况得分为0或-1,是因为如果田忌用最慢的马与齐王用最快的马比赛,那么田忌必输,得分为-1;如果田忌用最慢的马与齐王用次慢的马比赛,那么田忌可能赢,得分为0或1。 根据上述方法可以构造比赛得分矩阵,然后使用线性规划的方法求解矩阵博弈问题。具体来说,可以将田忌和齐王的得分视为两个向量,将比赛得分矩阵视为一个矩阵,然后使用线性规划求解最大值问题。 以下是Matlab程序实现: ```matlab % 田忌赛马问题的矩阵博弈求解 n = 5; % 马匹数量 speeds = randperm(10, n); % 马的速度,随机生成 score_mat = zeros(n, n); % 得分矩阵 for i = 1:n for j = 1:n if i == j % 同一匹马不能比赛 continue; end if speeds(i) > speeds(j) % 田忌胜 score_mat(i, j) = 1; else % 田忌败 score_mat(i, j) = -1; end end end f = -ones(n, 1); % 目标函数 A = score_mat'; % 约束条件矩阵 b = ones(n, 1); % 约束条件向量 lb = zeros(n, 1); % 变量下界 ub = ones(n, 1); % 变量上界 options = optimset('Display', 'off'); % 不显示求解过程 x = linprog(f, A, b, [], [], lb, ub, options); % 求解线性规划问题 max_score = -sum(x); % 最大得分 disp(['田忌最多能得' num2str(max_score) '分']); ``` 该程序首先随机生成马的速度,然后根据上述方法构造比赛得分矩阵,最后使用Matlab内置函数linprog求解线性规划问题,得到田忌最多能得多少分。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值