汤姆·齐格弗里德《纳什均衡与博弈论》笔记(1)冯·诺伊曼与博弈论

是按照自己的思路组织内容的,,,不然为什么要叫作笔记~~~

第一章 亚当·斯密之手——找寻自然法典

亚当·斯密与博弈论

要想理解斯密的观点和人类本性的现代观点以及博弈论之间的联系,有另一点非常重要,从漫画的角度来看斯密的故事,人类天性是自私的,而经济行为植根于此“事实”之上。博弈论看似也反映了此种假设。在博弈论最初的形式中,博弈论数学描述“理性的”行为,本质上是将“理性”和“自私”当作同义词。但按照今天的解释,博弈论并非假设人类总是表现得自私——或理性。博弈论告诉你如果人类确实表现得自私或理性,会是怎么样的情形

此外,亚当·斯密并不相信人类是普遍自私的(他是对的,正如博弈论实验最近再次发现的)。事实上,斯密预见了很多今天的实验经济学的发现。但现代评论家常常意识不到这点,因为他们忽略了《国富论》并非斯密唯一的著作。在撰写《国富论》时,斯密假设(像所有作者一样)他的读者也读过他的第一本书:1759年出版的《道德情操论》。因此他认为并不需要去重提他先前所描述的人类本性非常不相同的另一面。将两本书放在一起读,会发现斯密对人类天性的看法,比今天的经济学教科书所描述的更为善良,更为温和。这个观点是科林·卡默热告诉我的,他致力于理解博弈论和人类行为关系的前沿研究。卡默热的专业,“行为博弈论”,是被称为“行为经济学”的领域的一个分支。到20世纪80年代,当博弈论渗透到经济学的主流,经济学家们纷纷不再着迷于源于亚当·斯密流传发展而来的旧观点,即人类只是追求利益的理性演员。有些人甚至灵机一动想到通过有真人(有时是真的钱)参与的实验来对经济学理论进行检验。并不奇怪,实验发现人们常常表现得并“不理性”——即他们的选择并非总是最大化他们的利益。此类实验赢得了若干诺贝尔奖,并为了解经济活动背后的数学带来了一些新见解。在这些发展中,博弈论起了重要的作用,因为它将实验中所假设的人们追求利益或是“效用”的最大化进行了量化。在一个复杂的实验中,实际上使效用最大化的策略会是什么,并非总是非常明了。博弈论可以告诉你答案。不管怎样,卡默热发现了让人非常感兴趣的结果,即博弈论反映了人们在很多方面都违反了传统的经济学观点。但他告诉我,那些实验结果与亚当·斯密的观点并不相悖

在一次交谈中,我们在加州理工学院校园的一家咖啡店里,卡默热强调说斯密从来没有主张说所有人是天生自私的,只为了自己不考虑别人。斯密只是指出即使人们完全自私地行事,经济系统仍会有效地运作使一切向着好的方向发展。“这个观点是说,如果人们想要赚很多钱,实现的方式就是给你你所想要的,而他们并不关心你本身。这并不是在逻辑上暗示说人们对他人漠不关心,它只是表明即便彼此不关心,还是会有一个有效的资本主义经济去创造出人们最为想要的”,卡默热说,“我想亚当·斯密从某种程度上被误读了。人们说,‘天哪,亚当·斯密证明了人们彼此之间互不关心。’他所推测的,而且后来被数学验证的,是即使人们彼此不关心,市场也会很好地产生出合适的商品。但逻辑上这并不意味着人们互不关心。”所以人类天性并不一定像某些人相信的那样坚持利己。当然有些人是自私的,但也有人不是。

亚当·斯密与现代生物学

虽然达尔文的《物种起源》没有提到斯密,自然选择和适者生存的观点却像是从思维上继承了斯密的经济竞争观点。

斯密对达尔文的影响早在20年前就被科学史学家西尔凡·施维伯(Sil van Schweber)指出。但我是在读到斯蒂芬·杰伊·古尔德(Stephen Jay Gould)的关于生物学的进化大部头时,第一次看到其中的联系。古尔德全面分析了达尔文的著作,并且找出达尔文的物种起源论产生所受到的各种历史的、哲学的、科学的和文学的影响。其中最吸引人的是常被当今神创论和智能(原文如此)设计的支持者引用的神学家威廉·佩利(William Paley)的作品。佩利最著名的是他的钟表匠类比。如果你在地上找到了一块手表,佩利在1902年写道,你会看到它和石头没有丝毫相像。很明显,手表的各个部分是“有目的地组合在一起”,产生“规律的运动来指出一天中的时间”。这是必然的推断,佩利总结说,就是“这块手表必须有一个制造者……来理解它的结构,并且设计它的用途。”佩利的观点是生物世界满是有序的复杂体,精巧地适应高效生存的需要,那这一定来自于一种精巧的设计,所以,存在着一位设计者。为了促成其进化论,达尔文需要另一种逻辑来解释生命的效能。亚当·斯密提供了这种逻辑,古尔德总结说

“实际上,我会提出更强的观点,即自然选择的理论,本质上是亚当·斯密的经济学迁移到了自然界,”古尔德写道,“参与‘生存竞争’的单个有机体如同竞争中的公司。繁殖成功就好比利润。”换言之,如斯密提出的,并不需要设计一个有效的经济系统(事实上,找个设计师是个坏主意)。如果不去干预,经济系统会自己建设得很好,因此这个经济系统中的个体可以自由地追求个人利益。达尔文在生物学上看到一幅相似的图画:追求自身利益(生存与繁衍)的生物个体就会逐渐地建立起一套有如经济体系一样复杂的生命体系。在一段话中,达尔文特别引用了一个斯密最为青睐的主题概念——“劳动力分工”。斯密在其著名的别针工厂案例中阐述了分工如何产生效率。在达尔文看来这和自然界中新物种的产生颇为相似。

达尔文在《物种起源》中写道:“没有博物学家会怀疑所谓‘生理学劳动力分工’的好处;因此我们会相信对一种植物来说,只在一朵花或一整株植物上产生雄蕊,而在另一朵花或另一株上产生雌蕊是有益的。”他提出,和这种分工相似的益处可以解释有机体的多样性。“我想,我们可以假设一种物种的后代在结构变异上越多样化,它们就越会成功地生存,从而蚕食其他物种的领土。”达尔文写道。“因此在任何一块土地的综合经济系统(general economy)中,动物和植物的生活习性分化得越完全越广泛,这片土地上就会有越多的个体可以自足。”

很明显,达尔文的生命“综合经济系统”反映了和亚当·斯密的“政治经济学”相似的观点。如古尔德总结的,斯密的观点也许在经济学上并非完全适用,但用在生物学上则非常完美。而且斯密的见解反驳了佩利关于造物主必须存在的观点。“被佩利认为是上帝最荣耀的杰作……‘碰巧只是’相互竞争的个体在较低层面运作的结果。”古尔德宣称。

批注:还可以这样,interesting。但这样只能算是类比吧,能说是“同质”的嘛?

第二章 冯·诺伊曼之博弈论——博弈论的起源

效用

博弈论的一个贡献在于,它使“消费者怎样比较各种选择”这个曾经模糊的经济学概念得以精确化(通过一种叫做“效用”的度量,但是这个词看似简单,其实并不容易);更重要的是,它能展示如何决定获取最大可能“效用”所必须要采取的战略,即为了获得最大利润——假定这也是激烈的经济生活中每个理智的参与者的目标

博弈论才作为数学的分支以现代的形式出现,与另外两个颇为简单的思想相融合——效用和策略,前者是对你想得到的东西的度量;后者讨论如何得到你想要的。

效用主要是对价值或者选择的一种度量。这种思想有着悠久且错综复杂的历史,与被称之为功利主义的哲学理念密不可分。一位英国的社会哲学家和法律学者,杰里米·边沁(JeremyBentham),对此思想做出了更为著名的阐述。边沁于1780年对效用做了如下诠释:“这是任何物体都拥有的属性,它趋向产生利益、优势、愉悦、善良或者幸福……或者……避免危害、痛苦、邪恶或者不快的发生”。因此对于边沁而言,效用粗略地等同于幸福或愉悦——在“效用最大化”的过程中,个体将致力于寻求增加欢乐,减少痛苦。对于整个社会而言,效用最大化意味着“最大人数的最多幸福”。边沁的功利学说融合了亚当·斯密的一位好友,大卫·休谟(DavidHume)的某些哲学观点。英国的经济学家,大卫·李嘉图(David Ricardo),作为边沁的一个颇具影响力的后继者,把这种效用的思想融入了他的经济理念。

在经济学里,效用的作用取决于对其量化的表达。举个例子,快乐是不易量化的,但是,(正如边沁所说明的)可以把获取快乐的途径作为对效用的一种衡量。比如,财富就是一种途径,而它要比快乐容易量化得多。因此,在经济学里,通常的做法是通过金钱来衡量一个人的自身利益,这是一个比较不同事物价值的方便的交换媒介。但是,在生活中的很多方面,金钱并不能代表一切(除非你只是为了出版读物来赚钱),这样一来,找到一种普遍的定义,可以有效地以数学方式描述“效用”就显得很有必要了。

丹尼尔·伯努利(DanielBernoulli),这位瑞士数学家(他是那个时代著名的伯努利家族中的一员)于1738年,早于边沁很久便给出了一个著名的量化“效用”的数学方法。在解决他表弟尼古拉斯(Nicholas)提出的关于赌博的一个数学悖论的过程中,丹尼尔意识到“效用”并非简单地等同于数量大小。比如,给你一定数量的金钱,它的效用取决于在此之前你已经拥有金钱的数量,就100万美元的彩票大奖对比尔·盖茨的效用与对我的效用相比,要小得多。丹尼尔·伯努利提出了一种计算“效用”如何随着金钱的增加而减少的方法。

显然,效用,这个人人都想最大化的东西有时变得非常复杂。但在许多通常情况下,“效用”简单明了。打篮球时,效用是获得最多的得分。国际象棋比赛时,效用是将死对手的王牌局里,效用是赢得那个放赌注的盘子里所有的钱。很多时候,难的不是如何定义“效用”,而是如何选择一个好的战略来使其最大化。寻找最佳战略,这正是博弈论的目的所在

真正意义上尝试用数学来解决这个问题的人是英国人詹姆斯·瓦得格拉夫(James Waldegrave),他在1713年开始了这方面的工作。当时,他正在研究一种名叫“le Her”的两人纸牌游戏,他描述了一种寻找最佳策略的方法,使用的正是今天广为人知的“最小最大化原理”(有时也叫做“极小化极大原理”)。可惜的是,他当时并没有得到人们的多少关注,他的工作也因此并没有对之后博弈论的发展产生影响。很多其他的数学家也曾涉足这一今天被称为“博弈论”的数学领域,但并无一致的方法,也并未产生清晰可循的影响。直到20世纪,才开始有真正严密的研究探寻博弈论策略背后的数学原理。最早的工作是由一位德国数学家恩斯特·策梅洛(Ernst Zermelo)完成的,他在1913年发表了一篇讨论国际象棋游戏的文章,被认为是数学意义上博弈论的开端。文章中他只是选用了国际象棋游戏来阐释更普遍的一种两人博弈中的策略,在这种博弈中,两个局中人所采取的每一步行动都没有随机的成分在里面。顺便提一句,这个特征十分重要,扑克牌游戏不仅涉及策略,也受发牌运气好坏的影响。如果不幸抓到一手坏牌,很有可能使用再高明的决策也无法取胜。然而,在国际象棋游戏中,每一步怎么走完全由当局的两位选手决定,不存在洗牌、掷色子、抛硬币或者转幸运盘之类的运气成分。策梅洛将自身研究局限于纯粹策略的游戏,不考虑涵带任何复杂的随机因素。

他的这篇关于国际象棋游戏的论文显然使一些读者感到了困惑,因为文章里很多结论比较模糊,甚至有些地方存在矛盾。但是,他似乎试图说明这么一个结论:如果白棋成功地建立优势排列——一种“获胜的构造”——那么就可能以比各种可能的排列更少的步数结束比赛(在这里,优势排列是获得一种能保证白棋获胜的局势,不管黑棋怎么走白棋都会赢,当然也要假设白棋不会走坏棋)。利用集合论的原理(冯·诺依曼的数学专长之一),策梅洛证明了这个命题。在他的最初证明中,有些内容需要他本人和其他一些数学家之后艰辛工作的支持。但是,因为证明的意义在于它说明了可以用数学来分析这类策略博弈的重要特征,而关于国际象棋游戏中的具体策略那部分与前者相比就显得不是那么重要了。正如所证明的,国际象棋游戏是个很好的例证选择,因为它是“二人零和博弈”这种重要的策略博弈的一个完美的例子。在这种博弈中,只要一人赢了,不管赢的是什么,另一个人的结果就是输,对决双方的利益是相反的,所以称为“二人零和博弈”(国际象棋游戏也是一种“完全信息”游戏,这就是说任何时候,棋局的局势、所有的当局者的决定都是透明的,比如玩扑克牌的时候,出的牌都是翻开的)。不过,策梅洛并没有确切讨论国际象棋中的最佳策略是怎样的,甚至都没有涉及是否一定存在这种最佳策略。最早推动这个方向发展的是杰出的法国数学家E.波莱尔(Emile Borel),他于20世纪20年代初证明了在某些特殊情况下,二人零和博弈中存在最佳战略,但是对于能否证明在普遍情况下都存在最佳策略这个问题,他仍抱有疑虑。

这正是冯·诺依曼所做的工作。他说明了,在二人零和博弈中,总有一种办法找到最佳可能策略,这个策略能够使一个人的收益达到最大(或者说损失最小),而不用管这个得失的具体内容是什么,战略只与博弈规则和对手的选择有关。这就是冯·诺依曼最初于1926年12月提交“哥根廷数学学会”,之后于1928年在其本人的论文中充分阐述的最小最大化原理,此篇文章名为“ZurTheroriederGesellshaftsspiele”(客厅游戏理论),为他日后在经济学上的重大改革奠定了坚实的基础。 

鲁滨逊经济模型

在冯·诺依曼和摩根斯特恩研究这些问题的过程中,当时的经济学权威教科书将他们的一种简单的被称为“鲁宾逊经济”的模型奉为经典,在这个模型中,鲁宾逊孤身一人流落到孤岛上,处境艰难。这种情况下,他自己就是一个经济整体:自己决定怎样使用岛上的资源,使自己的收益最大化,而一切条件完全来自于自然环境。

马萨诸塞州大学的一位经济学家,塞缪尔·鲍尔斯(Samuel Bowles)曾向我讲解道:在教科书中,经济学被视为许多个体鲁宾逊的活动。在大型的经济生活中,消费者与价格之间相互作用,就像鲁宾逊与自然之间一样。这就是新古典主义的经济学观点。“每个人都这么教”,他告诉我,“但是奇怪的是,这种理论所讨论的社会交互是建立在并不参与社会活动的人之上的,也就是说,只与自然作用,跟其他人没有相互影响”。鲍尔斯认为:“博弈论采用的是一种截然不同的理论框架,在这种框架下,一个人的利益由其他人的行为决定,你的利益由我的行为决定,这样一来,我们就不得不策略性地思考问题了”。

这也正是冯·诺依曼和摩根斯特恩在1944年的著作中强调的。鲁宾逊·克鲁索经济从根本上与盖里甘岛经济不同。它不仅仅是影响你关于商品价格和服务的选择的来自他人的社会影响的综合。你的选择结果,以及获得你想得到的利益的能力,这些不可避免地都与他人的选择联系在一起。两位认为,“如果两个或更多的人相互之间交换货物,那么通常每个人的结果不仅依赖于他自己的行为,也受到其他人行为的影响”。从数学上而言,这意味着鲁宾逊的最大利益再也不是简单的只与他自己有关,因而计算中要包括具有竞争关系的目标的混合,涉及盖里甘、船长、百万富翁和他妻子、电影明星、教授和玛丽·安(Mary Ann)的最大利益。“这是古典数学里所没有处理过的问题”,书中这样写道。

事实上,边沁关于“最多人的最大化的利益”的阐述是没有数学意义的。这就像是在说你想用最少的花费获得最多的食物一样。仔细想想,你可以一分钱也不花(当然也就什么也没有),也可以拥有全世界的食物,前提是支付也很大。那么,你的选择是什么呢?这显然不能通过计算得到答案!在盖里甘岛经济中,不是关于最大人数的最大化利益,而是每个个体都想获得他的最大可能利益。换句话说,“不同的参与者同时要求获得最大的利益”。在每个个体寻求其最大利益的同时,他们的行为都会受到其他人行为的期望的影响,反之亦然。这与那个古老的“我知道他知道我知道”的故事相似。这就构成了社会经济,这个经济里有众多参与者,与鲁宾逊·克鲁索经济从本质上不同。冯·诺依曼和摩根斯特恩这样宣称,“策略博弈论正是为了解决这个问题而出现的”。

批注:原来如此。

当然,说起来容易,做起来难。意识到盖里甘岛问题比鲁宾逊·克鲁索问题复杂是回事,找到如何用数学来计算这个问题就是另一回事了。当然,你可以从简单的例子着手,比如,可以先分析两个人之间的相互作用。然后,在理解了两人如何交互作用之后,就可以用同样的原理来分析增加一个人会是什么情况了,再增加一个人,依此类推(事实上,一旦你掌握了把一个社会中所有个体的行为当作一个整体来分析的数学方法,你也就掌握了难以捉摸的自然法则了)。

不过,不难看出,一旦加进一个人,事情就迅速变得很难理解了。游戏(或经济)中的每个人基于很宽泛的变量进行选择。在鲁宾逊·克鲁索经济里,他的变量集合包含了所有影响他获得最大利益的因素。但是如果米诺(Minnow)在克鲁索的岛上靠了岸,每一个新加入的局中人都将带来他或她自身的变量,那么,克鲁索就不得不把这所有的变量都考虑进去了。

更重要的是,更多的局中人意味着更复杂的经济,更多的商品与服务,以及生产的更多不同途径。这样一来,社会经济瞬间变成了数学梦魇,即使是全才教授也无法解决。但是,为了经济学的发展,为了更好地理解社会,仍有希望,而希望就来自于测量体温的简单想法。

热力学与经济学

在将经济学和物理学做对比的过程中,冯·诺依曼和摩根斯特恩多次提到关于热的理论(或者用个更加有名的名字,热力学)。比如,他们指出,为了寻找精确地衡量热的办法并没有直接产生热力学理论,因为物理学家首先需要一种理论来理解如何用准确清晰的方法来衡量热。类似的,博弈论需要首先发展起来,为经济学家提供正确衡量经济变量所需要的工具。

热力学理论的例子还起了另外一个重要的作用,它使得博弈论里一个基本的问题得以阐述清楚。在书的开端,两位作者就申明,他们无意讨论“效用”的各种不同定义之间的微妙差别,这是哲学上的一片沼泽,他们不想冒这个险。在他们看来,如果只是为了经济上的应用而发展博弈论,那么只要简单地将“效用”和货币等价起来就可以了。如何来衡量效用呢?对于商人,用金钱(作为利润)来衡量是合乎逻辑的;对于消费者,付出(最小的花销)是个不错的选择,或者你也可以认为一个物体的效用就是你愿意为它付出的价钱。金钱可以被用作货币,将任何人的需求转化为更为具体的物体、事件、体验或者其他的任何东西。所以,将效用与金钱等同是一个方便简化的假设,在这种假设下,理论就可以集中关注如何获得你想要的东西,而不必陷于如何界定你想要的东西的复杂问题之中。

不过,问题并没这么简单,关于效用还有一个重要的方面是冯·诺依曼和摩根斯特恩不得不讨论的。首先,是否能够用数值的方法定义效用,以使它更易符合数学理论?(伯努利曾提出一种计算效用的方法,但是他没有尝试证明这个概念可以为做理性抉择提供可靠一致的基础)。只要效用可以用数值的概念来体现,金钱(显然是数值的)绝对是对效用的复杂概念的一个很好的替代。既然这样,他们要解决的问题就转化为证明效用可以用一种严格的数学的方式定义。这意味着确认原理,从其中,效用的表达可以被推导出,并能得到量化。

正如事后证明的那样,效用可以量化,使用的方法和物理学家用来建立有关温度的严密的科学定义的方法并无差异。毕竟,效用和温度的原始表述是近似的。效用,或者说优先选择,可以被看作是排序,如果你认为A优于B,B优于C,当然也就认为A优于C了。但是,要想用数字来表示A优于B多少,B优于C多少,就不那么容易了。这曾经与热力学极为相似——在热力学发展起来之前,我们能做的是比较两个物体的冷热,但并无必要说出相差多少,当然这也不精确。但是现在,基于热力学原理的绝对温度值给予温度一个精确量化的意义。冯·诺依曼和摩根斯特恩说明了如何类似地将排序转换为对效用的数值上的精确衡量。

这种方法的本质可以从“大家来交易”(let’s make a deal)这个游戏的改进版中看出来[年轻的读者可能对此不熟,这是名噪一时的电视游戏秀,在这个游戏里,主持人芒太·霍尔(Monty Hall)会给游戏选手一个交换他们手中奖品的机会,当然,交换的结果可能是更有价值的东西,但是也得冒着得到一个不值钱小礼物的风险]。假设,芒太给你3个选择:一部宝马敞篷车,一台高端宽屏等离子电视,或者是一辆二手三轮车。我们认为你最想要宝马,其次是电视机,最后是三轮车。在这种情况下对这3种产品的相对效用进行排序是很容易的。难的是怎么抉择,你的选择会得到那台等离子电视,或者50%的机会得到宝马。也就是说,已知电视机在1号门后,宝马则在2号或3号门的后面,另一个后面就是那辆三轮车了。这样你就得好好想想了。如果选择1号门,那就意味着你认为电视机的价值比一半宝马的高,但是假设游戏更加复杂,有更多的门,并且获得宝马的机会变成60%甚至70%,怎么办?在某一点,你将可能想去选择获得宝马的机会,这时,你就可以得出结论:效用在数值上是相等的。也就是说,对于你而言,等离子电视机价值等于宝马的75%(为了技术上的精确,还要加上三轮车的25%)。由此,我们得出结论:如果要给“效用”一个数值的价值,就不得不武断地给一种选择赋值,这样一来,利用“大家来交易”里概率的思想,就可以拿这个给定数值的选择和其他选择相比较了。

到此为止,一切看起来都显得如此合理。但是,还有一个问题:在社会经济中,问题不仅仅是你个人的效用,你必须考虑其他人的选择。在小规模的“盖里甘岛”经济中,纯粹的战略选择可能会被诸如部分游戏参与者之间的联合这样的因素破坏。

如何解决呢?热力学理论再一次为我们提供了帮助。温度是对分子运动快慢的衡量,总体而言,描述单个分子的速度就像计算鲁宾逊·克鲁索的效用一样简单。但是对于“盖里甘岛”,就变得很困难了,这就像热力学中,要想计算较少数目的相互作用的分子的速度实际上是不可能的。但是如果计算的是亿万以上的分子,情况又不一样了,此时分子间的相互作用趋于平均,利用热力学理论就可以对温度做出精确的预测(当然,这背后的数学是统计力学,在之后关于博弈论经历的章节中,将会看到它更为重要的作用)。

冯·诺依曼和摩根斯特恩指出:“大数目通常要比小规模的数目更容易处理”。这也正是阿西莫夫(Asimov)在《心灵历史学家》中提出的观点,他认为:对于数目庞大的问题,尽管不能监测每个分子个体,但能预测它们的整体行为,这正是测量气体温度时所使用的方法。这种情况下,可以测量和所有分子的平均速度相关的某个数值,这个数值能反映单个分子之间是如何相互作用的。那么,为什么不能用同样的办法来处理人与人之间的问题呢?哈瑞·塞尔登(Hari Seldon)想到了这一点。对于一个规模足够大的经济,这个方法是适用的。“当参与者的数目变得尤为庞大时,”冯·诺依曼和摩根斯特恩写道,“每个参与者个体的影响就有可能可以忽略不计。”

借助在书的开端对“效用”建立的坚实的基础,通过将金钱作为对效用的衡量,两位作者后面的工作就进展得很快了。书的主体也就投入了探讨如何寻找获得最多金钱的最佳策略的问题上面。

基于这一点,一个很重要的问题需要弄明白,那就是书中的策略究竟指的是什么。在博弈论中,策略是一种特定的行为过程,而不是游戏中的一般玩法。例如,这和打网球不同,网球中,策略仅仅指“主动进攻”和“保守打法”。博弈论中的策略是对可能出现的种种情况所做出的一系列的选择。在网球比赛中,你的战略可能是“当对手发球时绝不冲到网前;无论比赛时是平局还是领先都要尽力发球和截球;落后时一定要呆在后场”。当然对其他情况你还有其他的应对策略。

博弈论中有关策略的另外一个关键点是——“单纯策略”与“混合策略”的区别。在网球赛中,你可能会在每次发球后迅速地冲到网前(这是一个单纯策略),你也可能每3次发球中有一次冲到网前,另两次守在底线(这就是混合策略)。通常,要想让博弈论发挥作用,混合策略是不可或缺的。

对于任何一件事情,问题不在于是否总存在一种好的普遍适用的策略,而是是否存在涵盖所有可能情况的策略行为的一系列最优的准则。事实上,对于二人零和博弈,答案是肯定的。利用冯·诺依曼1928年发表的论文中的最小最大化原理,一定可以找到这种最佳策略。他的关于这个原理的证明是出了名的复杂。但是其本质精华可以被提炼为简单易记的道理:打扑克时,虚张声势不可避免。

最小最大化原理

利用随机方法,从多种纯策略中进行选择并组成混合策略的思想正是冯·诺依曼证明最小最大化原理中的本质核心内容。通过选择正确的混合策略,在对手也精通博弈论的情况下,能够保证你获得可能获得的最大收益。如果对手不懂博弈论,那你可能会收益更大。

批注:要深入了解下。

  • 25
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值