博弈论入门

(来源文献、书籍)(菜鸟的片面理解,欢迎讨论)

纯策略与混合策略

若某学校的两个学生,他们一起学习获得效用10,一起出去玩获得效用2,一个出去玩一个学习效用为0

学生A的策略集=学生B的策略集={学习,玩耍},当他们明确会选择策略集中的某个策略,是为纯策略博弈,若学生A与x的概率选择学习,(1-x)的概率选择玩耍,是为混合策略型博弈

在这个例子中两位参与者都选择策略学习时效用最高,为此博弈的纳什均衡,任何策略的改变都会使得效用降低。

博弈论的分类

非合作博弈与合作博弈

非合作博弈以个人行动作为一个基元;合作博弈中以参与人的联合行动作为基于,参与人的工作是对团体的利益分配问题进行博弈。在博弈中,如果参与人之间有强有力的誓言、协议或承诺, 认为该博弈是合作的。非合作博弈中的每个参与人及其偏好构成基本建模单元。

通俗来说,当有1w的money需要3个人来分,有两个人给出相同的策略就第三个也得听从。这是三人的相互博弈是合作博弈;有1w的市场份额,三家公司,三家公司提出策略吸引市场份额来争取最多的市场份额。三者为非合作博弈

静态博弈与动态博弈

静态博弈中参与人会同时选择自己的行动,在博弈过程中不会收到其他参与者的任何信息。

动态博弈中参与人的行动会有先后顺序,个人的选择往往会取决于对他人行动的了解,或者针对他们的行动做出利于自身的动作行为。例如象棋

策略性博弈(同时行为博弈)属于静态博弈,每个参与人一劳永逸的选择自己的行动方案,并且所以参与人同时实施自身策略

完全信息博弈与不完全信息博弈

在参与人开始自己行动的最初时点上,有些参与人又私人信息为其他参与人不知道的,这样的博弈称为不完全信息博弈。完全信息博弈中博弈的每个层面都是共同知识

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值