博弈论基础


1.基本概念:

博弈均衡:所谓博弈均衡指博弈中所有参与者都不想改变自己的策略的这样一种状态。

占优策略(Dominant Strategy):每一个博弈中的企业通常都拥有不止一个竞争策略,其所有策略的集合构成了该企业的策略集。在企业各自的策略集中,如果存在一个与其他竞争对手可能采取的策略无关的最优选择,则称其为占优策略(Dominant Strategy),与之相对的其他策略则为劣势策略。占优策略是博弈论(game theory)中的专业术语,所谓的占优策略就是指无论竞争对手如何反应都属于本企业最佳选择的竞争策略

占优策略均衡:博弈中的所有参与者的占优策略组合所构成的就是占有策略均衡。

零和博弈:博弈论的一个概念,属非合作博弈,指参与博弈的双方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加的总和永远为“零”。双方不存在合作的可能。零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分。

非零和博弈:是一种非合作下的博弈,博弈中各方的收益或损失的总和不是零值,它区别于零和博弈。在非零和博弈中,对局各方不再是完全对立的,一个局中人的所得并不一定意味着其他局中人要遭受同样数量的损失。也就是说,博弈参与者之间不存在“你之得即我之失”这样一种简单的关系。其中隐含的一个意思是,参与者这间可能存在某种共同的利益,蕴涵博弈参与才“双赢”或者“多赢”这一博弈论中非常重要的理念。譬如,在恋爱中一方受伤的时候,对方并不是一定得到满足。也有可能双方一起能得精神的满足。也有可能双方一起受伤。通常,彼此精神的损益不是零和的。正和博弈:指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整体的利益有所增加;负和博弈:双方都有损失。


2.纳什均衡:

a、如果A的选择是给定的,则B的选择是最优的;如果B的选择是给定的,则A的选择是最优的;这样策略组合的均衡为纳什均衡;

b、它是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,即给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略,从而没有任何人有积极性打破这种均衡,即僵局。

c. 经典囚徒困境:

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

    • 1
      点赞
    • 5
      收藏
      觉得还不错? 一键收藏
    • 0
      评论
    博弈论中,有一种决策称为Best Response,通俗的意思就是选择一种策略使得团体利益最大化。C语言学习成绩的评定方式分为两种,一种是自由刷题模式(compete),没有固定标准,刷题越多者排名越靠前,其期末分数越高;另一种是规定每个人必须做够多少道题(standard),达到要求就能取得相应分数。 假设一个班级中的学生分为A、B两类,A类同学学习热情很高,乐于做题,采用compete模式可以获得成就感并且在期末拿到高分,compete模式可以让他们有10分的收益;采用standard模式他们也可以在期末拿到高分,但不能满足他们的求知欲,standard模式可以让他们有8分的收益。B类同学仅仅希望期末拿高分,如果采用compete模式,他们竞争不过A类同学,期末成绩不理想,因此compete模式能给他们6分的收益;如果采用standard模式,他们可以完成规定任务并拿到高分,因此standard模式可以让他们有10分的收益。 编程输入A类和B类同学分别占班级总人数的百分比,分别计算并输出采用compete和standard两种刷题模式下的全班总收益,并输出这个班级在这场博弈中的Best Response是哪种模式。 【注】程序中使用的数据类型为float 程序运行结果示例1: Input percent of A and B:0.2 0.8↙ compete = 6.8000 standard = 9.6000 The Best Response is standard! 程序运行结果示例2: Input percent of A and B:0.8 0.2↙ compete = 9.2000 standard = 8.4000 The Best Response is compete! 程序运行结果示例3: Input percent of A and B:0.5 0.5↙ compete = 8.0000 standard = 9.0000 The Best Response is standard! 输入提示信息:"Input percent of A and B:" 输入格式:"%f%f" 输出格式:"compete = %.4f\nstandard = %.4f\n" 输出提示信息:"The Best Response is compete!" 输出提示信息:"The Best Response is standard!"
    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值