博弈论学习总结(一)

   上个星期五,听了一节博弈论入门讲座,虽然只是简单介绍了博弈论的一些基本概念和常见用例,不过激起了我浓厚的兴趣,所以就想着找点资料学习学习。最后发现耶鲁大学有博弈论公开课,24节,兴奋了好久,现在在一集集学习中。今天看了第一集,因为专业性的概念比较多,我又有经常性的健忘症,所以就想做个学习总结,以后回忆起来也方便。其实很早以前就听说过博弈论,不过一直不知道它是什么,应用在什么方面,只想着是一门高深的学问,自己在这方面也没多大兴趣,也就提不起兴致了。这次是个很偶然的机会,在一个好的主讲人的指导下,接触了这门绝对是经典的课程,学习的欲望也就被激发了。要知道博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机、军事战略和其他很多学科都有广泛的应用。

   博弈论到底是什么呢?专业性的解释:博弈论是研究相互影响的决策主体的理性决策行为,以及这些决策的均衡结果的理论。通俗一点来说,博弈论实际上是多人在平等的对局中各自利用别人的策略变换自己的对抗策略,达到取胜的目的。也就是大家一起来玩心理战,看看谁是最后赢家。

  博弈论中,有三大基本要素:①players②strategies③payoff。首先既然是玩一场博弈游戏,那肯定要有参加者,在游戏中,我们需要对参加者做一定架设,才能使分析得到的博弈结果更加理性化。(1)players所在乎的都转化为payoff来衡量(2)players完全了解博弈的结构(3)players都是完全理性的。只有players满足以上三个条件,我们的game才能够继续进行。其次是策略,一个局中,任意参加者的一个可行的自始至终全局筹划的一个行动方案,称为这个局中参加者的一个策略。如果在一个博弈中局中参加者总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。最后是收益,一局博弈结局时的结果称为得失。而整场游戏结束,我们就是通过每个参赛者的最后收益,来判断赢家输家。

  介绍完博弈论的基本概念,我们还要了解一些专业名词。(以下我们都以两人博弈为前提,参加者分别是player1和player2,他们都有自己相应的策略选择,并且双方选择的策略不同,将导致最终两人所获取的payoff不同)

  ①最佳回应:针对player2的策略T,可以使得player1得到的payoff达到最大的策略,就称为player1对player2策略T的最佳回应。

  ②严格最佳回应:针对player2的策略T,如果player1只有一个最佳回应,那么就称为严格最佳回应。

  ③占优策略:不管player 2采取何种策略,player 1的最佳回应可以是同一个策略,称这样的策略为player 1的占优策略。

  ④严格占优策略:如果player 1(或player 2)的占优策略只有一个,那么占优策略也称为严格占优策略。

在博弈论中,有一个很出名的例子,在课上,也有提到,就是囚徒困境。下面以这个例子作为典型,更好理解这些概念。

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 
若二人都互相检举(互相“背叛”),则二人同样判监2年。 
用表格概述如下: 

 甲不坦白甲坦白
乙不坦白(-1,-1)(-10,0)
乙坦白(0,-10)(-4,-4)
囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。

现在我们来分析一下这个表格,当甲选择“不坦白”的时候,乙选择“不坦白”,被关1年,选择“坦白”,被立即释放,所以对于甲的“不坦白”策略,乙的最佳回应策略是“坦白”。

同时因为乙只有一个最佳回应策略,所以这个策略也是严格最佳回应。

而无论甲选择什么策略,乙的最佳回应策略都是“坦白”,所以“坦白”就是乙的占优策略,同时因为只有一个策略,它也是严格占优策略。

       针对上述表格,对甲可以做出相同的分析,“坦白”也是甲的严格占优策略,当存在严格占优策略时,又有假设参加者是理性的,自私的,只为最大化自己的利益,这样双方都会绝对选取自己的严格占优策略,而博弈的结果最终就会是两人都因“坦白”而被关四年。对于有严格占优策略的game,结局是很好分析的。

  介绍完了专业术语,来总结一下每节课学到的主要原理吧。

  第一课:①Do not play a strictly dominated strategy.不要选择一个严格的劣势策略。严格的劣势策略是和严格占优策略相对应的,指的是不论对方采取什么策略,采取的这个策略比采取其它策略中的任意一个策略得到的payoff更差的策略。

                ②put yourself in others's shoes and try firgure out what they're going to do.把自己放在对手的位置上,考虑他们会怎么做,也就是俗话说的换位思考。

              其实这只是博弈论的一个入门,了解一些简单的概念知识。既不深奥,也不晦涩,但是要能灵活应用它们,真的是很困难的一件事哦!

             最后,说说自己特别感兴趣的一个game吧。游戏前提大致是,你身处一个大班级中,班级中的每一个人都是game的参加者。游戏规则是每个人在1~100中选择一个数字写在纸条上上交,不让其它人知道,最后会计算所有人选择数字的平均值。谁选择的数字最接近 平均值的2/3,谁就是最后赢家,如果假设参加者符合上述players的三个假设,请问你会选哪个数字?要是不符合那三个假设,你又会做何选择?(ps:现实情况中,肯定是后面一种情况比较常见的,但是我觉得后面一种情况要猜对,还有点运气成分咯! 

           


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值