耶鲁大学 博弈论(Game Theory) 笔记1
博弈论主要研究策略形势即不完全竞争情况,策略形势被定义为行为影响结果,但结果不仅自身行为也取决于其他人的行为。
博弈论笔记1
summary
成绩游戏
不向你的邻居展示你在做什么,在表格上写下 α \alpha α或 β \beta β,你可以把它看作是一个成绩评价。我们将随机将你的表格与另一张表格配对。你和你的同伴都不知道你是和谁配对的。以下是本课程的成绩分配方法:
- 如果你填 α \alpha α而你的搭档填 β \beta β,那么你会得到A级,你的搭档会得到C级。
- 如果你和搭档都填 α \alpha α,那么你们会得到B-。
- 如果你填 β \beta β而你的搭档填 α \alpha α,那么你会得到C级,你的搭档会得到A级。
- 如果你和搭档都填 β \beta β,那么你们会得到B+。
这些可能的选择被称为“`策略”,可以表达为如下形式:
一个理性的人在成绩游戏中应该选择什么策略
我们首先需要知道那个人关心什么:收益的每个结果对这个人产生什么影响。博弈论不能告诉我们应该分配多少收益结果。其取决于偏好(和道德情感?)不仅仅是你,还有你的对手。一旦收益是公知信息,博弈论就能显示出更多内容。
可能的收益:evil git
如果每个玩家都是一个邪恶的家伙,那么每个玩家都只关心自己的等级(例如假设她更喜欢a而不是B等等),其收益可能如下:
如果我的同伴选择了
α
\alpha
α,此时我选择
α
\alpha
α带来的收益为0,选择
β
\beta
β带来的收益为-1。如果我的同伴选择了
β
\beta
β,此时我选择
α
\alpha
α带来的收益为3,选择
β
\beta
β带来的收益为1.
定义: 如果选择策略
α
\alpha
α的结果严格优于选择策略
β
\beta
β,在不考虑其他人选择的情况下,
α
\alpha
α相对于
β
\beta
β是严格优势策略。
额外定义: 如果策略
α
\alpha
α和策略
β
\beta
β收益相同,在不考虑其他人选择的情况下,至少会出现一次选择是策略
α
\alpha
α支配了策略
β
\beta
β。
Lesson1 永远不要选择严格劣势策略
在知道收益规则后,同伴也会选择
α
\alpha
α。我们最终都会得到0分,尽管有双方都得到1分的更好结果。
Lesson2 理性玩家的理性游戏可能导致坏的结果
像这样的游戏被称为 “囚徒困境”。
其他可能收益:indignant angels
与所有玩家都是邪恶的情况不同的是
假设每个人不仅关心自己的成绩,而且还关心与她配对人的成绩。每个玩家都是indignant angels(愤怒天使),她想要得到A,但她感到内疚,因为这是以她的搭档得到C为代价的,愧疚使她的回报从3降至-1。相反,如果她得到了C,而她的配对得到了A,那么愤怒就会把回报从1降到-3。
和以前一样,如果我同伴选择了
α
\alpha
α,那么我选择
α
\alpha
α将会比选择
β
\beta
β所得到的收益更高。如果我同伴选择了
β
\beta
β,那么我选择
β
\beta
β将会比选择
α
\alpha
α所得到的收益更高。
在这种情况下没有严格支配策略,最佳选择 取决于我认为我的同伴可能会做什么。
Lesson3 在判断选择什么动作前,清楚自身的收益以及其他玩家的收益。
The Evil Git versus the Indignant Angel
如果我是Evil Git但是同伴是Indignant Angel的情况下,收益将变成如下形式:
我的策略
α
\alpha
α相对于
β
\beta
β是严格优势策略,因此我应该选择策略
α
\alpha
α。
The Indignant Angel versus the Evil Git
如果我是Indignant Angel但是同伴是Evil Git的情况下,收益将变成如下形式:
我的两种策略都没有支配对方。但是,我同伴的策略 α \alpha α相对于 β \beta β是严格优势策略。因此,如果我知道她是理性的,那么我知道她会选择策略 α \alpha α。在这种情况下,我应该选择策略 α \alpha α(以得到0>-3)。
Lesson4 如果你没有占优势的策略,那就站在别人的立场上去分析他们会怎么做。
如果我不知道我对手的收益怎么办?
如果我是Evil Git,我的策略 α \alpha α相对于 β \beta β是严格优势策略,因此我会选择 α \alpha α。如果我是Indignant Angel,取决于我认为人口中的Evil Git和Indignant Angel的比例如何。