耶鲁大学《博弈论》课程——迭代剔除

迭代剔除 Iterative Deletion

迭代剔除劣势策略:先找出劣势策略,剔除劣势策略,再继续审视这个博弈,找出哪些现在也成了劣势策略,然后剔除他们。如此反复进行,这个过程被称之为迭代剔除劣势策略。它揭示了以下过程的主旨:站在对方的立场上去换位思考,推测对手的行动策略,同时想想对手也会站在你的立场推测你的意图,这样反复进行。

中位选民定理】案例:

假设有两个候选人,这两个候选人为了选举必须确定自己的政治主张,这两个人就是参与者(players)。

策略是:他们要从一系列政治主张中选择一个政治立场。简单点说,一系列政治主张中一共有10个政治立场,这是个立场我们分别称为:
1 2 3 4 5 6 7 8 9 10 越靠近左边的立场越代表左翼分子的立场,越靠近右边的立场越代表右翼分子的立场。

这两个候选人需要确立自己的政治立场,这里假设每个政治立场都会有10%的选票,他们平均分布,选民会投票给离他们政治立场最近的候选人,出现平局时该立场的选票会分摊。

我们假设这个博弈的收益是候选者可能获得的最多选票。

最开始,1和10是劣势策略,1严格劣于2,10严格劣于9。
证明:1严格劣于2。
U1(1,1) = 50% < U1(2,1) = 90%
U1(1,2) = 10% < U1(2,2) = 50%
U1(1,3) = 15% < U1(2,3) = 20%
U1(1,4) = 20% < U1(2,4) = 25%
U1(1,5) = 25% < U1(2,5) = 30%
U1(1,6) = 30% < U1(2,6) = 35%
U1(1,7) = 35% < U1(2,7) = 40%
U1(1,8) = 40% < U1(2,8) = 45%
U1(1,9) = 45% < U1(2,9) = 50%
U1(1,10) = 50% < U1(2,10) = 55%
(这里,U1(i,j)表示候选人1在选择策略i而对手选择策略j是候选人1所获得选票的比例。)
所以对于任意可选的j,U1(1,j) < U2(2,j)。所以1严格劣于2。
同理,10严格劣于9。
于是,考虑到大家都不会选1和10,剔除掉策略1和策略10。

在剔除1和10的情况下,考虑新产生的严格劣势策略。发现2严格劣于3,9严格劣于8。
证明:2严格劣于3。
因为1和10已经被证明为严格劣势策略了,所以对手不会选择策略1和策略10,这种情况下,
U1(2,2) = 50% < U1(3,2) = 80%   (注意,如果没有剔除1和10,3并非严格优于2,比如U1(2,1)=90%>U1(3,1)=85%)
U1(2,3) = 20% < U1(3,3) = 25%
U1(2,4) = 25% < U1(3,4) = 30%
U1(2,5) = 30% < U1(3,5) = 35%
U1(2,6) = 35% < U1(3,6) = 40%
U1(2,7) = 40% < U1(3,7) = 45%
U1(2,8) = 45% < U1(3,8) = 50%
U1(2,9) = 50% < U1(3,9) = 55%
所以对于任意可选的j,U1(2,j) < U2(3,j)。所以2严格劣于3。
同理,9严格劣于8。
......
所以最后就剩下了策略5和策略6。 -- 中位选民定理

在经济学中的一个应用:

产品植入。在产品植入领域里,假设你在考虑设立一个加油站,你会想如果加油站能均匀覆盖城镇每一个角落或者遍布整条公路那该多好,这样无论你在哪里需要加油时,附近就会有一个加油站,那该会非常的方便。但是事实上加油站都设在差不多相同的地点,他们趋向设立于同一个路口。他们这么做的原因是:他们都为了拉拢附近的客源或是那些刚刚耗完汽油的的顾客而相互竞争,通过挤在一起避免自己因为选址的问题而被淘汰出局。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值