初识博弈论(个人笔记)

博弈的基本要素:参与人、策略空间、信息、结果与得失
完全信息,指信息对于局中人来说是完全公开的
不完全信息,不仅指绝对意义上的不完全,有可能是认识能力的限制
均衡:指局中人所采取最佳策略构成的策略组合

博弈的基本分类

合作博弈:局中人达成合作时,如何分配收益,参与者需要达成一种具有约束力的协议,在这个范围内选择有利于各方的政策,比如同行业不同企业间的联合定价盟约
非合作博弈:参与者无法达成具有约束力的协议,参与者在利益仙湖影响的局势中如何选择自己最大利益的问题,比如广告,和价格战

静态博弈:双方是否同时决策,如果双方是同时决策的,或者后决策的一方不知道先决策者采取的策略的博弈叫静态博弈
非静态博弈:后决策的一方知道先决策的一方的策略,并可以制定出对应的策略

完全信息博弈:指每一位参与者对其它的参与者的信息都有详细的了解
不完全信息博弈:就是不满足完全信息博弈的情况

重复博弈:同一个博弈能够多次重复进行,具有连续性,参与者不仅要寻找一次博弈时自己利益的最大化,还要考虑长远的情况下的利益最大化,迫使参与者追求利益的同时,提高诚信度,重视信誉
一次性博弈:不能重复博弈的博弈叫一次性博弈,如抛一枚硬币
无限次博弈和有限次重复博弈的共同点:试图"合作"和惩罚"不合作"

零和、正和、负和

零和:指博弈各方的收益之和永远为0或某个常数,双方不存在合作的可能
如物理学中的能量守恒,动量守恒

纳什均衡

指任何一方采取的策略都是其它所有方采取的策略组合的下的最佳策略
当其它所有人都不改变策略时,为了使自己的利益最大,任何一方都不会或者无法改变自己的策略,这个时候的策略组合就是一个纳什均衡

例子

小鸿正在图书馆枯坐,此时有一位漂亮的妹纸来找小鸿玩个游戏
游戏规则是这样子的双方各自亮出硬币的一面
如果硬币都为正,则妹纸给小鸿三元
如果硬币都为反,则妹纸给小鸿一元
否则小鸿给妹纸两元,
小鸿简单算了一下,感觉自己不亏,还能认识一个可爱的妹纸
于是小鸿和这个妹纸玩了一下午,最后输得裤衩子都不剩
小鸿事后想了一晚上也没想明白为什么?你能帮助他嘛?

设妹纸出正的概率为x,出反的概率为1-x
小鸿出正的概率为y,出反的概率为1-y

从小鸿的角度看,为了使自身在对方无论出什么的情况下,自己的利益都是一样的(否则对方就会改变策略来使自己的受益不一样)
假设妹纸出正,小鸿收益为 3x - 2 (1-x)
假设妹纸出反,小鸿收益为 1-x - 2x
小鸿为了使对方无论出什么,自己的收益总是一样的
于是有 3x - 2 (1-x) = 1-x - 2x 解得 x = 3/8
收益期望为 3*3/8 - 2 * (1-3/8) = 9/8 - 10/8 = - 1/8
收益为负的1/8元

从妹纸的角度看
同样得到 y = 3/8
收益为 1/8元
因此只要每次采取3/8出正,5/8出反.小鸿最后无论无何也会输得裤衩子都不剩

假设小鸿全出正
(3+3+3-2-2-2-2-2) = -1
假设小鸿全出反
(1+1+1+1+1 -2-2-2) = -1
因此无论小鸿怎么抉择,都是要输的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值