博奕论初探

博弈论可以广泛的应用于包括政治、经济以及军事等各个领域。与此同时,它也可应用于计算机软件理论领域,衍生出很多出色的算法。这里我对博弈论做了一些初步的了解和学习。

1 什么是博弈论

在说明博弈论的概念之前,我首先给出一个书中的例子,它的名字叫做共同投资问题。

        设想有两位投资者,共同投资一个较大的项目,他们可以获得较大的回报。如果他们俩至少有一个抽出资金用于一个小项目投资,他肯定可以获得相应回报,但比投资较大项目时获益要小得多。然而他的这一做法次导致较大项目陷入险境,从而使另一位投资者蒙受损失。是冒一定风险坚持投资较大项目以获得较大回报,还是抽回资金投资小项目至少有个“旱涝保收”,这就需要投资者作出决策并实施行动。
        对于这样一个问题,我们也可以先考虑一个类似的狩猎“游戏”:两个猎人围住了一头鹿,他们各卡住鹿可能逃跑的两个关口中的一个。只要他们齐心协力,鹿就会成为他们的猎物。如果此时周围跑过一只小兔,两位猎人中的任何一个只要去抓兔子一定会获得成功,他会抓到一只小兔,但鹿却从他把把官运亨通的关口逃跑。现在他们必须同时作出决定:是猎鹿还是抓兔子。这是一个简单的游戏,游戏的结局不外乎是:二人合力猎鹿并平分一头鹿;二人都各自去抓兔子并各人有一只兔子进账;一人去抓兔而另一人坚持猎良师,那么抓兔者猎获一只兔子而另一位则两手空空。边小学生也能知道,第三个结局是三种结局中最差的一种。通常,半头鹿比兔子值钱,因此第一种结局对于两个猎人来说也许是最好的,但是,谁也很难否定两人都去抓兔子是很不错的结局,因为毕竟每个人都有所获。那么究竟以何种结局作为这场狩猎游戏的预测比较合理呢?事实上,如果没有更多的信息——诸如猎人的习性,对猎物价值的评估,或者对自己获益的期望等等——合理地预测结局将是十分困难的。
        同样,在二人共同投资问题上,两位投资者都希望了解投资较大或较小项目中各自可能的获益、对手的习惯以及对投资获益的期望等等,在了解尽可能多的情况下,他们才有可能同时作出自己的最佳决策。

上面的游戏模型中似乎有如下的特点:游戏中常有两个以上的参与者,他们在游戏中都有着自己的切身利益,我们称之为局中人。每个局中人都有着自己的可行行动集供自己选择,这种选择毫无疑问地会影响其他局中人的利益。游戏中的各个局中人理性地采取或选择自己的策略行为,使得在这种相互制约,相互影响的依存关系中,尽可能地提高自己的利得,这正是游戏理论的关键所在。就像下棋游戏中的各方使尽浑身解数使自己尽可能赢或至少不输一样。将英文“The game theory”翻译成“博弈论”,其原因盖出于此。我们也可以用一句话来概括博奕论:博奕论就是关于包含相互依存情况中理性行为的研究。所谓相互依存,通常是指博弈中的任何一个局中人受到其他局中人的行为的影响,反过来,他的行为也影响到其他局中人。

用我自己的理解,博弈论事实上是一场两人以上的游戏。在游戏中,每个人以赢利为最终目标,围绕这个目标,他们各自分析其他玩家的策略并针对它们采取最有利自己的策略,与此同时,他们采取的策略又会影响到其他玩家。

2 博奕的分类

博弈论中,局中人、策略空间(每个局中人可以采用的策略)、盈利函数(局中人真正关心的东西)构成博弈的信息,从信息的角度,博奕可以分为完全信息与不完全信息两类。所谓完全信息是指每一个局中人对于自己以及其他局中人的策略空间,盈利函数等知识有完全的了解,否则,博弈就是不完全信息的。

博弈的分类还可以从局中人行动的先后次序着手,如果局中人同时选择行动,则称博弈为静态的。要求“同时“”并不一定等于规定在同一时刻大家一起行动。通常在时间上虽有行动的先后,但局中人彼此不知道其他人在采取什么具体行动(直到博弈结束时),其效果仍等价于他们在同时行动,此时我们仍称它是静态博弈。倘若局中人的行动有先后顺序,后行动者可以观察到前行动者的行动,并在这苦础上采取自己最有利的策略,博弈就转为动态形式。

将上面的情况两两交叉,博弈可以分为:完全信息静态博奕、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈四种情况。

目前我对于博奕论在计算机上的应用还不甚清楚,期待到交大实验室后更进一步的学习。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值