Nash equilibrium

From wikipedia

 

 

納什平衡,又稱為非合作賽局平衡,是博弈论的一個重要概念,以约翰·納什命名。

如果某情況下無一參與者可以獨自行動而增加收益,則此策略組合被稱為納什均衡點

例子

經典的例子就是囚徒困境,囚徒困境是一个非零和博弈。 大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。如果两人均不招供,将最有利,只被判刑半年。 于是,两人同时陷入招供还是不招供的两难处境。 但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供, 这种情况就称为纳氏均衡点。 这时,个体的理性利益选择是与整体的理性利益选择不一致的。

囚犯甲的博弈矩阵

囚犯甲
招供
不招供
囚犯乙
招供
判刑兩年
甲判刑十年;乙即時獲釋
不招供
甲即時獲釋;乙判刑十年
判刑半年

基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。事實上,这样两人都选择坦白的策略以及因此被判两年的结局被稱作是“纳什均衡”(也叫非合作均衡),換言之,在此情況下,無一參與者可以「獨自行動」(即單方面改變決定)而增加收穫。

 

学术争议和批评

第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem) 证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下卻找不到,因此仍不能解决问题。[來源請求]在数学意义上,纳什并没有超越角谷静夫不动点定理。

经过《美丽心灵》的Sylvia Nasar(书作者)和Ron Howard(电影作者)这样的主流媒体的介入,角谷静夫(Kakutani)在这些人的作品里被完全忽略。有人认为,「纳什平衡」(Nash equilibrium)的更合适的名字应该叫作「角谷静夫—纳什博弈论不动点」(Kakutani-Nash game-theoretic fixed point)或「角谷静夫—纳什平衡」(Kakutani-Nash equilibrium),没有角谷静夫不动点定理,纳什的证明没有多大学术意义。《美丽心灵》完全忽视角谷静夫之关键贡献的作法有待商榷。

第二,納什的非合作(non-cooperative)博弈论模型仅仅是突破了博弈论中的一个局限。一个更大的局限是,博弈论面对的往往是由几十亿节点的庞大对象构成的社会、经济等复杂行为,但冯·诺伊曼(Von Neumann)和納什的研究是针对两三个节点的小规模博弈论(有人称之为tiny-scale toy case)。[來源請求]

这个假设的不完善处,可能比假设大家都是合作的(cooperative)更严重。因为在经济学里,一个庞大社会里的人极不可能全部都是合作的,非合作的情况通常在庞大对象的情形中更普遍,而在两三个节点的小规模经济中倒反而影响较小。既然改了合作前提为非合作前提,却仍然停留在两三个节点的小规模博弈论中,这是一个不可忽视的缺陷。最近香港城市大学和北京清华大学的学者群邓小铁、姚期智在基于复杂度理论的大规模博弈论上有所进展。

MIT的一位计算机科学博士生的博士论文(PDF http://people.csail.mit.edu/costis/thesis.pdf )——获得2008年度美国计算机协会学位论文奖——认为经济学家的推测是错误的,找到纳什均衡点是几乎不可能的事。 目前担任MIT电机工程和计算机科学系助理教授的Constantinos Daskalakis与 UC伯克利的Christos Papadimitriou、英国利物浦大学的Paul Goldberg合作,证明对某些博弈来说,穷全世界所有计算机之力,在整个宇宙寿命的时间内也计算不出纳什均衡点。Daskalakis相信,计算机找不到,人类也不可能找到。纳什均衡属于NP问题,Daskalakis证明它属于NP问题的一个子集,不是通常认为的NP-完全问题,而是PPAD-完全问题。这项研究成果被一些计算机科学家认为是十年来博弈论领域的最大进展。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值