博弈论相关知识

一、博弈论

研究各方策略相互影响的条件下理性决策人的决策行为的一种理论

博弈分为合作博弈和非合作博弈。合作博弈强调的是团体理性,强调的是效率、公正、公平;非合作博弈讲的是理性人追求自身的利益最大化。

非合作博弈包括完全信息与非完全信息博弈、静态博弈与动态博弈

非合作博弈都存在纳什均衡解。纳什均衡的数学定义:一场博弈用G表示,Si表示博弈方i的策略,ui表示收益。在博弈G={S1,…,Sn:u1,…,un}中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…si-1,si+1,…,sn*)的最佳对策,也即ui(s1*,…si-1,si,si+1,…,sn)≥ui(s1*,…si-1,sij,si+1,…,sn)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。

用囚徒困境来理解:

A的思考方式:假设B坦白,A选择对自己利益最大的选项(-8,-10),会选择坦白(-8);假设B选择抵赖,A的利益为min(0,-1),选择坦白(0),因此最终的结果是A坦白;

B的思考方式:假设A坦白,利益为(-8,-10),选择坦白(-8);假设A抵赖,利益为(0,-1),选择坦白(0);因此最终B的结果为坦白;

最终的策略为(坦白,坦白)为纳什均衡。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值