简简单单

任何一个傻瓜都可以写出计算机可以理解的代码。只有写出人类容易理解的代码,才是优秀的程序员。

原创  博弈论总结 收藏

一、定义

研究决策主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡的问题。

二、构成

参与人、参与人的偏好、信息、可获得的策略行动和支付函数。

1.参与人(player) 博弈的主体,它是指在博弈中做决策的行为者(agent),可能是个人,也可能是群体或组织,如国家、企业、欧盟、北约、联合国等,只要它们内部采取一致的行动与外界进行策略互动,就可以看成一个参与人。
行动(action)是参与人的决策变量。
结果(outcome)是指博弈分析者感兴趣的要素集合。
参与人、行动和结果统称为博弈规则。
2.策略(strategy) 在一个静态博弈(static game)中,一个策略是参与人一个给定的可能行动。
均衡(equilibrium) 是所有参与人的最优策略的组合。
均衡结果(equilibrium outcome)是指所有参与人的最优行动的组合。

3.支付(payoff)  也称为效用(utility),是反映参与人对一个结果渴望程度的数字。

4.共同知识(common knowledge) 指“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道……”的知识,博弈的结构经常被假定为共同知识。
信息(information) 是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。
完全信息(complete information) 是指每个参与人的特征、支付函数(参与人选择的行动组合借助于它决定参与人的支付)以及策略空间在所有参与人中是共同知识。
三、基本假设:
1.参与人是理性的
理性的个人对每一件事都有偏好,例如面包好于烧饼,烧饼加蜂蜜好于面包加黄油,摇滚乐好于古典音乐等等。
说他们是理性的,是因为他们选择能够最好地满足自己偏好的行动。
2.他们有这些理性的共同知识
3.他们知道博弈规则

四、类型:

1.分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。企业之间的联合定价就属于合作博弈,而经常挑起价格战的企业采用的便主要是非合作博弈。在合作博弈中往往包含着非合作博弈,如石油输出国组织是合作博弈的产物,但其中为了各自利益的超产和争吵又属于非合作博弈。

2.分为零和博弈、常和博弈与变和博弈。零和博弈指的是所有博弈方的得益总和为零,各种赌博就属于零和博弈。例如4个人参与一场赌博,其中3个人输了总共1000元,那么另外一个人必然赢了1000元。期货交易市场的参与者之间的关系也属于零和博弈。人们平常所说的“损人利己”实际上也包含有零和博弈的意思。常和博弈则是指所有博弈方的得益总和等于非零的常数。例如若干人分配一份总额既定的财产乃典型的常和博弈。变和博弈则是指随着博弈参与者选择的策略不同,各方的得益总和也不同。如在同一个股票市场,面对同样的大盘走势,伴随着投资者的投资策略不同,有可能大部分人赚钱而小部分人亏钱,也有可能小部分人赚而大部分人亏,甚至还有可能所有人都赚或都亏。

3.分为静态博弈与动态博弈。所有博弈方同时或可看作同时选择策略,采取行动的博弈是静态博弈。譬如,在投标活动中,投标人投出标书一般虽有先后,但因为所有投标人在开标前都不知道其他投标人的标价,因此可看作同时选择策略,采取行动。体育竞赛中,双方出场阵容的选择也属于静态博弈。动态博弈则是指博弈方的选择和行动有先后之分,后行者可以根据先行者的策略选择来决定自己的策略。如A企业降价后,B企业也跟着降价;足球比赛中,一方换上一名攻击性前卫后,另一方针对性地换上一名后卫;如此等等。

4.四是分为完全信息博弈与不完全信息博弈。在前一种博弈中,每一个参与者都拥有全部的相关信息,只拥有部分相关信息的便属于后一种博弈。

四类非合作博弈: 
1.完全信息静态博弈:如囚徒困境问题
2.完全信息动态博弈
3.不完全信息静态博弈
4.不完全信息动态博弈
 
五、经典案例
1、囚徒困境
假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。警察局将这两名嫌疑犯分别关押以防他们串供。两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。
对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一囚徒交代了,自己就将可能处于非常不利的境地。对于囚徒A而言,不管囚徒B采取何种策略,他的最佳策略都是交代。对于囚徒B而言也是如此。最后两人都会选择交代。因此,囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。

2、智猪博弈
假设猪圈里有一大一小两只猪,猪圈的一头有一个猪食槽,另一头有一个控制猪食供应的按钮,揿一下按钮会有10个单位的猪食进槽。若小猪去揿,大猪先吃,大猪可吃到9个单位,小猪揿好后奔过来,则只能吃到1个单位;若大猪去揿,小猪先吃,小猪可吃到6个单位,大猪吃到4个单位;若同时去揿,奔过来再同时吃,大猪可吃到7个单位,小猪吃到3个单位。在这种情况下,不论大猪采取何种策略,小猪的最佳策略是等待,即在食槽边等待大猪去揿按钮,然后坐享其成。而由于小猪总是会选择等待,大猪无奈之下只好去揿按钮。
智猪博弈现象在日常生活中也是司空见惯的。如大股东行使监督上市公司的职责,而小股东则坐享这种监督带来的利益,即所谓“搭便车”;爱清洁的人经常打扫公共楼道,其他人搭便车;山村中出外跑运输、做生意的人掏钱修路,其他村民走修好的路;等等。
3、斗鸡博弈
两只公鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却。但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死网破的决心。
这类博弈也不胜枚举。如两人反向过同一独木桥,一般来说,必有一人选择后退。在该种博弈中,非理性、非理智的形象塑造往往是一种可选择的策略运用。如那种看上去不把自己的生命当回事的人,或者看上去有点醉醺醺、傻乎乎的人,往往能逼退独木桥上的另一人。还有夫妻争吵也常常是一个“斗鸡博弈”,吵到最后,一般地,总有一方对于对方的唠叨、责骂装聋作哑,或者干脆妻子回娘家去冷却怒火。冷战期间,美苏两大军事集团的争斗也是一种“斗鸡博弈”。在企业经营方面,在市场容量有限的条件下,一家企业投资了某一项目,另一家企业便会放弃对该项目的觊觎。
六、博弈策略:
威胁
合作

发表于 @ 2007年07月28日 22:29:00 | 评论( loading... ) | 编辑| 举报| 收藏

旧一篇:玩物丧志,勿以恶小而为之 | 新一篇:重构笔记

  • 发表评论
  • 评论内容:
  •  
Copyright © tsd3698
Powered by CSDN Blog