耶鲁大学 博弈论(Game Theory) 笔记3-迭代剔除和中位选民定理
回顾
在第二课中讨论了剔除劣势策略,观察某个博弈并找出劣势策略,剔除劣势策略。再次观察博弈,寻找新形成的劣势策略并剔除,如此反复的过程。
选举案例
假设存在两个候选人,为了选举这两人会明确自身的政治立场,两个候选人即为参与者。策略为两人要在一系列的政治主张中选择一个政治立场。假设有10个政治立场,每个政治立场都会有10%的得票,且选民投票给最接近他们的候选人,若出现平局时该立场的选票会被平均分摊,候选者希望尽可能最大化获得的选票。
结果讨论
若我选择立场1而对手选择立场1即
U
1
(
1
,
1
)
U_1(1,1)
U1(1,1),此时:
两人平分票,
U
1
(
1
,
1
)
U_1(1,1)
U1(1,1)=50%。
若我选择立场2而对手选择立场1即
U
1
(
2
,
1
)
U_1(2,1)
U1(2,1),此时:
则我将获得90%的的票,
U
1
(
2
,
1
)
U_1(2,1)
U1(2,1)=90%。
若我选择立场1而对手选择立场2即
U
1
(
1
,
2
)
U_1(1,2)
U1(1,2),此时:
则我将获得10%的的票,
U
1
(
1
,
2
)
U_1(1,2)
U1(1,2)=10%。
若我选择立场2而对手选择立场2即
U
1
(
2
,
2
)
U_1(2,2)
U1(2,2),此时:
两人平分票,
U
1
(
2
,
2
)
U_1(2,2)
U1(2,2)=50%。
U
1
(
1
,
1
)
<
U
1
(
2
,
1
)
U
1
(
1
,
2
)
<
U
1
(
2
,
2
)
U_1(1,1)<U_1(2,1)\\ U_1(1,2)<U_1(2,2)
U1(1,1)<U1(2,1)U1(1,2)<U1(2,2)
综上可见,策略2优于策略1
继续计算,
U
1
(
1
,
3
)
U_1(1,3)
U1(1,3)=15%
U
1
(
1
,
1
)
=
50
%
<
U
1
(
2
,
1
)
=
90
%
U
1
(
1
,
2
)
=
10
%
<
U
1
(
2
,
2
)
=
50
%
U
1
(
1
,
3
)
=
15
%
<
U
1
(
2
,
3
)
=
20
%
U
1
(
1
,
4
)
=
20
%
<
U
1
(
2
,
4
)
=
25
%
U_1(1,1)=50\% < U_1(2,1)=90\%\\ U_1(1,2)=10\% < U_1(2,2)=50\%\\ U_1(1,3)=15\% < U_1(2,3)=20\%\\ U_1(1,4)=20\% < U_1(2,4)=25\%\\
U1(1,1)=50%<U1(2,1)=90%U1(1,2)=10%<U1(2,2)=50%U1(1,3)=15%<U1(2,3)=20%U1(1,4)=20%<U1(2,4)=25%
策略2严格优势于策略1.
同理可得,策略9严格优势于策略10
然而,在对手选择策略1时,我选择3的收益小于选择2的收益。
U
1
(
2
,
1
)
=
90
%
<
U
1
(
3
,
1
)
=
85
%
U_1(2,1)=90\% < U_1(3,1)=85\%\\
U1(2,1)=90%<U1(3,1)=85%
如果剔除劣势策略1和10,则有:
U
1
(
2
,
2
)
=
50
%
<
U
1
(
3
,
2
)
=
80
%
U
1
(
2
,
3
)
=
20
%
<
U
1
(
3
,
3
)
=
50
%
U
1
(
2
,
4
)
=
25
%
<
U
1
(
3
,
4
)
=
30
%
U
1
(
2
,
5
)
=
30
%
<
U
1
(
3
,
5
)
=
35
%
U_1(2,2)=50\%<U_1(3,2)=80\%\\ U_1(2,3)=20\%<U_1(3,3)=50\%\\ U_1(2,4)=25\%<U_1(3,4)=30\%\\ U_1(2,5)=30\%<U_1(3,5)=35\%\\
U1(2,2)=50%<U1(3,2)=80%U1(2,3)=20%<U1(3,3)=50%U1(2,4)=25%<U1(3,4)=30%U1(2,5)=30%<U1(3,5)=35%
策略2和9在原博弈中本不是劣势策略,但当剔除策略1和10后,其变成劣势策略。按照上述方法进行迭代剔除后仅剩下策略5和6。在政治学中,这也被称为中间选民定理。
选举模型所存在问题
- 现实中选民是不均匀分布的
- 可能会存在不止两位候选人
- 存在弃权票
- 候选人未必能够坚守他的立场,即选民未必相信候选人的立场
- 初选
- 多维度
现实中选民并非均匀分布;选民常根据候选人的性格而非政治立
场来进行投票,政治立场仅仅是单一维度;只适用于两个候选人的情况;同时存在
弃权票;选民未必相信候选人所声明的立场。
多维度在政治课程中有完善的模型,本课程不讨论。
最佳对策
下面的博弈中,选上是对手选左的最佳对策,选中时对手选右的最佳对策。
在不知道对手所选择策略的情况下,即对手选择各种策略的可能性相同
(
1
2
,
1
2
)
(\frac{1}{2},\frac{1}{2})
(21,21)下的预期收益为:
U
:
5
×
1
2
+
0
×
1
2
=
2.5
M
:
1
×
1
2
+
4
×
1
2
=
2.5
D
:
4
×
1
2
+
2
×
1
2
=
3
U: 5\times\frac{1}{2}+0\times\frac{1}{2}=2.5\\ \quad\\ M:1\times\frac{1}{2}+4\times\frac{1}{2}=2.5\\ \quad\\ D:4\times\frac{1}{2}+2\times\frac{1}{2}=3\\
U:5×21+0×21=2.5M:1×21+4×21=2.5D:4×21+2×21=3
直线代表对手选 R 的不同概率上,我方的预期收益