纳什:博弈论大师

本来不想在这里整篇的引用别处的文章的,因为我觉得blog需要自己的东西才能叫做blog,光是翻译或者引用没有多大意义,但是。。。我还是整篇的copy了这篇文章,不仅是因为我对博弈还有点兴趣,而且更多的是因为对钠什的尊敬,昨晚上十一点过,我才静下心来,完完整整的读完了介绍,增长了很多知识,希望对大家也有帮助
 
 2001年环球公司出品的电影《美丽心灵》,取材于同名传记,艺术地再现了数学天才、1994年诺贝尔经济学奖得主之一、罹患妄想型精神分裂症三十多年又奇迹般恢复的小约翰?福布斯?纳什传奇的人生故事。这部分别获得2002年金球和奥斯卡四项大奖的影片,连同银幕背后的人物原型,深深震撼了全世界人们的心灵。为纳什带来诺贝尔奖之殊荣的、他对博弈论发展的巨大贡献,以及他的坎坷生平,也再次引起人们极大的反响和关注。
 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…
 面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯?诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡?摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解” 或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略?怎样才是“合理” ?应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对於每一个二人零和博弈,都能够找到一个“最小最大解” 。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在於,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望,做最坏的打算” 。
 虽然二人零和博弈的解决具有重大的意义,但作为一个理论来说,它应用于实践的范围是极其有限的。不提耽于游戏的玩家,可以说除了军事竞争,几乎难再有用武之地。二人零和博弈主要的局限性有二,一是在各种社会活动中,常常有多方参与而不是只有两方;二是参与各方相互作用的结果并不一定有人得利就有人失利,整个群体可能具有大於零或小于零的净获利。对於后者,让我们来看一个历史上最经典的有趣个例: “囚徒困境” 。话说警方抓到两个盗窃犯,惜证据尚不足,遂寄希望于嫌犯自己招供。警方把两个犯人隔离起来,分别审问,交代政策如下:坦白从宽,抗拒从严!如果你招了,另一个人没招,那么就将你释放,另一人判20年;同样如果你不招,另一个人招了,那么你得被判20年,另一个人被释放。如果两个人都招,警方证据就足了,两人都判10年。至於两个人都不招的情况,不用警方交代,两个人都得判,但因证据不力,判得都要轻许多,比如1年。警方最后说,那边还有个警察,对你的同伙交代一模一样的政策呢。罪犯心里打起小九九,如果对方招了,我招是10年,不招是20年,是招划算;如果对方不招,我招是无罪释放,不招是1年,还是招划算。於是乎,招!两个“精明” 的小偷都招了,都被判了10年,正中警方下怀。聪明的读者,其实如果两个小偷都不招,就会被各判1年,对他们来说岂不更好?在这个囚徒困境问题中,参与者仍是两名(两个盗窃犯) ,但这不再是一个零和的博弈,人受损并不等於我收益。两个小偷可能一共被判20年,或一共只被判2年。
 对於多人参与、非零和的博弈问题,在纳什之前,无人知道如何求解,或者说怎样找到类似于最小最大解那样的“平衡” 。而找不到解,下面的研究当然无法进行,更谈不上指导实践了。纳什对博弈论的巨大贡献,正在於他天才性地提出了“纳什均衡” 的基本概念,为更加普遍广泛的博弈问题找到了解。纳什均衡的基本思想是,在这个解集中所有参与者的策略都是对其他参与者所用策略的最佳对策,没有人能够通过单单改变自己的策略提高收益。以前面的囚徒困境为例,如果小偷甲相信小偷乙招供,那么他的最佳策略是招供,而如果小偷乙相信小偷甲招供,那么他的最佳策略仍是招供。这就是一个纳什均衡,它是“自确定” 的。在囚徒困境中,只存在一个纳什均衡。但若将条件改变一下,在许多其它的具体问题中,纳什均衡可能不止一个。纳什巧妙地运用数学技巧,证明了如下纳什定理:对於任何一个n人参与,非合作博弈(零和或非零和) ,如果每个参与者都只有有限条策略,那么一定存在至少一个纳什均衡解集。象许多科学上最杰出的思想一样,这一概念以极简洁明了的方式解决了悬而未解的难题。看似简单,似乎属於那种“本来我也能想到” 的东西,然而那时除了纳什,一代宗师诺伊曼也没有想到。纳什均衡的提出,对博弈论的发展产生了革命性的影响,纳什均衡的概念已成为现代博弈论的基石和中心(虽然在少数博弈理论家中此点仍有争议) 。纳什的好友,普林斯顿大学经济学教授迪克西特曾说,“如果每次有人说起或写下纳什均衡这几个字,纳什都能拿到一块钱的话,那么他现在会是个大富翁了!”
 上面提到的博弈理论试图解决的都是非合作型问题,也就是参与者之间除了决策结果相互影响,没有其它形式的信息交流。通过囚徒困境一例可以看出,如果参与者两个小偷之间能够彼此商议,他们做出的策略决定会截然不同(当然是两人一起抵赖划算) 。诚然,在各种生活行为中,人与人之间除了竞争关系,还存在合作关系,常常是两种关系并存,合理的合作能够给双方带来共同利益。这是合作型博弈论研究的范畴。诺伊曼在《博弈论与经济行为》一书中建立了合作型博弈论的基本模型,但是对於其中及其重要的双向协商问题(即参与者如何“讨价还价”) ,没有能给出一个确定的解。纳什对这一领域同样做出了卓越贡献,他不仅提出了讨价还价问题的公理化解法,直接裨益劳动经济和国际贸易,还在理论上利用这个解法良好的预测性进一步提出纳什方案:将合作型博弈中的协商转化为一个更广泛的非合作型博弈的一个步骤--协商的目的最终仍是最大化自己的利益。此外,在测试博弈论的行为实验学上,纳什也是一名先驱。他曾展开讨价还价和联盟形成的实验,并曾敏锐地指出,在其他实验者的囚徒困境实验里,反复让一对参与者重复实验实际上将单步策略问题转化成了一个大的多步策略问题。而后一思想初次提示了后来发展起来的在经济和政治领域起重要作用的重复博弈理论中缄默共谋的可能性。
 这些也许看起来略显枯燥的理论,以逻辑推理为工具对人们日常生活中的竞争和合作行为进行严谨有序的数学归纳,当数学家们孜孜不倦地将直觉上升为科学,再反作用于生活时,其影响之深远难以尽述。今天,纳什为之做出基础性贡献的现代博弈理论经过许多专家的不断发展,不仅自身理论体系日臻成熟和完善,而且被广泛应用于经济学、政治学、军事学甚至生物学等各个领域。在生物学领域,博弈论被用于研究种族遗传学和进化生物学中种间和种内的竞争,以及单个基因之间的竞争,并反过来推动博弈论的思想发展。在政治、军事学领域,博弈论被用于分析选举策略、战争起因、立法议程安排等等重大事宜。在经济学领域,博弈论更是已经融入整个学科的主流,经济学教材和杂志无不收入博弈论的内容,经济学家们已经把研究策略相互作用的博弈论当作最合适的分析工具分析各类经济问题,诸如公共经济、国际贸易、自然资源经济、工业管理等等,等等。就博弈论应用于经济学的直接效益,举个实例,如《美丽心灵》一书中提到,1994年美国政府向商家拍卖大部份电磁波谱。这一多回合拍卖由一批博弈论专家本着最大化政府收益和各商家的利用率原则精心设计,取得极大的成功。政府获得超过一百亿美元的收入,各频率的波谱也都找到了满意的归宿。与此相对映的是,新西兰一个类似却没有经过博弈理论设计的拍卖会惨遭失败。政府只获得预计收入的15%,而被拍卖的频率也未能物尽其用。譬如因为无人竞争,一个大学生只花1美元就买到了一个电视台许可证!正因为博弈论对现代经济学具有如此重大的冲击和影响,1994年瑞典皇家学院宣布该年全世界科学家的最高荣誉诺贝尔奖之经济学奖颁发给包括纳什在内的三位数学家,以表彰他们对非合作型博弈论的开拓性分析。
 世界终于因为博弈论而承认了纳什的天才,这一年,他已是66岁的老人。与其在科学上令人眩目的杰出贡献相比,他用几十年漫长的岁月书写的充满才华和激情、充满磨难和苦痛、交织理性和疯狂的传奇人生,竟也毫不逊色,教人无限感慨和敬仰。纳什出生于1928年一个电子工程师家庭,少年时代一方面性格孤僻,一方面显示出非凡的数学才能。17岁进入今卡耐基梅隆大学时原专业是化学工程,但是在慧眼识珠的老师的建议下,转行专攻数学。在此期间他选修了一门国际经济学课程,从而引发了对经济学命题的兴趣,后来发表的关于合作型博弈讨价还价问题的论文就是源于这时的一些想法。20岁时纳什在卡耐基拿到数学学士和硕士学位,接受了普林斯顿大学优裕的奖学金,成为这里的一名研究生。他对许多数学学科都表现出兴趣,如拓扑学、代数学、几何学、博弈论和逻辑学等。着手准备博士论文时,他决心独创一个属於自己的崭新课题。最终过去曾思考的讨价还价问题引导他建立非合作型博弈论的基本原理。1949年,21岁的纳什写下一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法、整个现代非合作型博弈论中最重要的思想之一,也奠定了44年后他获得诺贝尔奖的基础。1950年纳什曾带着他的想法去会见当时名满天下的诺伊曼,遭到断然否定,但是在普林斯顿大学宽松的科学环境下,他的论文仍然得到发表并引起了轰动。同年他以论文《非合作型博弈》获得数学博士学位。
 以纯数学家自居的纳什,毕业后在兰德研究所和普林斯顿大学工作期间,证明了一个反直觉的等距嵌入定理,并引入全新的方法证明困难得多的高维等距嵌入定理,强有力地推动了对偏微分方程存在性、唯一性和连续性定理的证明。对於纯数学家来说,数学是精神的艺术体操,评判一项研究的优劣,标准在於其数学深度及是否引入了数学新思想、新方法,或是解决了长期悬而未解的难题。从这一角度,纳什的这一成果,以及数年后于麻省理工学院工作时的更加艰深的数学研究,比他的纳什均衡还要让数学同行们信服。确实,1958年纳什因其在数学领域的优异工作被美国《财富》杂志评为新一代天才数学家中最杰出的人物。然而,天有不测风云,人有旦夕祸福,就在纳什春风得意、事业就要达到顶峰时,却突然遭受命运无情的重重一撞,从云端坠下地狱。纳什在他的而立之年患上了精神分裂症。
 他不是一个完美的人,早在1952年,纳什懈逅了一位大他5岁的姑娘,与之交往,次年有了个私生子,此后仍一直与她保持若即若离的关系。1956年他的父母发现了儿子的风流韵事,不久后他的父亲就去世了,不知是否与此打击有关,也不知纳什是否曾为此自责。1957年他与麻省理工学院年轻美丽的女学生爱莉西娅结婚,此后四十多年患难与共的爱情和亲情可以见证,这或许是他的个人生活中最完美、最幸运的一刻。1958年爱莉西娅身怀有孕,尚未分娩,纳什的精神状况就开始恶化。他的举止越来越古怪,一步步走向心智狂乱。
 纳什所患的是妄想型精神分裂症,所有精神疾病中最可怕的一种。病人被时断时续不切实际的疯狂念头充斥头脑,并且会产生幻视、幻听,同自己假想出来的人交谈。纳什会着对空气说,某份报纸里藏有来自另一个星球的只有他能破解的信息;会突然辞去在麻省的职位,只身跑到欧洲,要放弃美国国籍,还是爱莉西娅跟去把他拖回来;在家中,他不断地威胁着妻子爱莉西娅。万般无奈之下,爱莉西娅于1962年和纳什离婚。但是她对他的忠诚爱情并没有就此消失。70年纳什的母亲去世,而他的姐姐无法负担他,就在纳什孤苦无依、就要流落街头的时候,善良的爱莉西娅接他来与自己同住。她不仅在起居上关心他,而且以女性特有的细心敏感照料着他的心情。她体贴他不肯去医院封闭治疗的愿望,并把家搬到远离喧嚣的普林斯顿,希望宁静熟悉的学术氛围有助于稳定纳什的情绪。
 这是一场奇特的博弈。纳什,这个研究理性策略的数学天才,猝然间失去了赖以自傲的理性思维,身不由己地在清醒和疯狂之间来回挣扎徘徊,是永远坠向深渊还是走回家园?在那个无人能解的世界里,他始终没有放弃的对数学的热爱。我们无法知道纳什所承受的所有痛苦,但是足可以揣摩意愿和能力之间的巨大冲突是怎样漫长的精神灾难。幸运的是,在这场博弈里,还有一个忠贞不渝的参与者,当他喃喃自语说着谁也听不懂的话时,当他象幽灵似的逡巡于绿色校园时,总是一双温存的眼睛和手臂勇敢地陪伴着他。世上最坚强的两样东西,意志和爱情,结合在一起,创造出一个最优策略,那就是 - 奇迹。是的,世界目睹了这场博弈的喜剧性结局,在纳什罹患精神分裂症三十余年后的九十年代,他的精神逐渐恢复了正常。1994年纳什博士在为诺贝尔奖撰写的自传中没有提及精神疾病给他带来的痛苦,倒是说精神失常使他摆脱了常轨思维的束缚,可以帮助他创造全新的理论。结尾处他写道,“从统计上说,任何数学家或科学家在66岁时,都似乎已经不可能再有大的建树。但我仍在努力着,那25年异型思维的‘假期’ 本来就是不正常的。这样我就还有希望,也许通过目前的研究或将来产生的新思想,我还能够做出一点有价值的东西。” 读到此处,不能不为之一叹,叹这个博弈论大师非凡的天才,叹他顽强的意志,和对科学毫无保留的执着之心!或许,这些也是爱莉西娅爱的源泉罢?
 世事如棋局局新。前一辈人的辉煌和辛酸俱已成为历史,未来掌握在后来者的手中,取决于他(她) 们的每一个决定。我们的人生,又将会是一场什么样的博弈呢?
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值