博弈论用来解释和解决现实问题和现象的效果如何?都有哪些实例?(转)

1 篇文章 1 订阅
1 篇文章 1 订阅

很多砍价高手的砍价策略都可以用博弈论来解释,但他们不需要学习博弈论就能成为砍价高手。
因而他的答案只回答了问题的前半部分,即博弈论用来解释现实的效果如何。

所以我来补充点内容吧。我本身不是做这个方向的,有什么疏漏或错误的地方就请大家指正了。

一般情况下当我们说博弈论时,指的都是非合作博弈,它研究的其实不是在给定条件下参与人应该做什么决策,而是更进一步地,讨论当每个参与人都在给定的博弈框架下选择各自最优策略所可能带来的结果。

一个定义完整的博弈包含参与人、规则、结果和支付四个部分。
参与人就是博弈的参与者,规则定义了参与人在博弈每个阶段的信息集和可选行动集,结果定义了参与人行动每个集合分别会造成的结果,支付则定义了每个参与人在每个结果上分别获得的效用。

用囚徒困境举例的话,这个博弈的参与人是两个囚徒,A和B。
规则:这个博弈每个参与人都只有两个可选行动,背叛和不背叛,决策时都不知道对方行动。
结果:两个参与人都有两个行动可以选择,因而结果也就分别有4种。都不背叛一种、都背叛一种、一个背叛一个不背叛两种。
支付:当两个人都背叛时,两者都会入狱,但也都会获得警方奖励,两者获得效用都为0;当一个背叛另一个不背叛时,背叛者被释放,同时还有奖励,不背叛者入狱,因而效用分别为2和-1;当两者都不背叛时,都被释放,但都没奖励,效用都为1。
这个博弈可以用下面的表格表示:

**********背叛 不背叛

背叛 ***(0,0) (2,-1)

不背叛 (-1,2) (1,1)


//不能插入表格好蛋疼……

纵横两轴是两个参与人,行/列是参与人的行动集,每组行动所对应的单位格都是博弈的一个结果,单位格内的数组是相应结果下各个参与人所获得的支付。
或者也可以用下面的图表示:

空心和实心的点代表不同参与人,实线表示参与人可选行动,被椭圆虚线保卫表示空心参与人在决策时无法区分这两个点,也就是不知道对方行动。底部的每个分叉都是博弈的一个结果,每个结果都对应一组支付。

这个博弈的结果很简单:不管对方选择如何,对任意参与人而言选择背叛所获得的支付都比不背叛更高,因而两个参与人的占优策略都是选择背叛。相应地,背叛/背叛也就是这个博弈的纳什均衡。
OK,这里又给出了博弈论里十分重要的两个概念:策略和纳什均衡。
策略:策略是一个完整的行动方案,它规定了参与人在每种情况下选择的行动。继续上面的例子的话,背叛是一个行动,而在任何情况下都选择背叛则是一个策略。
纳什均衡:每个参与人都选择一个策略,就构成一个策略组合。纳什均衡是一个策略组合,当出现这个组合时,任何参与人都无法通过调整自身策略来获取更高支付。

看到这里大概已经有些人开始头晕了……不过大家也都应该清楚了,博弈论最关注的东西其实是均衡。在均衡下所有参与人都不会改变策略,因而我们就可以通过博弈论来解释甚至预言给定条件下各个参与人的行为及其结果。也可以通过设计规则来把博弈导向特定均衡来获取相应的结果。

然后再举点博弈论具体应用的例子。
在经济学方面,拍卖、产业组织、机制设计等等都能找到它应用的例子。比如著名的维克里拍卖(二级密封价格拍卖)就是一个例子。
在经济学范围以外,政治和社会学上的应用不必说,生物学方面也有演化博弈论。
甚至在计算机方面也有应用,据说姚期智提出的Yao's principle就是一个例子,但我完全不懂这个……

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值