如何计算近似纳什均衡_如何通俗的理解纳什均衡点?

导读:如何通俗的理解纳什均衡点?

一、市场上有2家企业A和B,都是卖纸的,纸的成本都是2元钱,A和B都卖5块钱。

有一天A降价到4块钱,于是A销量大增,B销量大减。B看到了后,降价到3块钱,于是B销量大增,A销量大减。

但如果价格战一直这样打下去,对谁也没有好处,于是A也选择降价到3块钱,和B一样。B看到了A降价到3块钱,B既不敢涨价,也不敢降价。涨价了市场就丢了,降价了,就赚不到钱甚至赔钱。所以A和B都不会再去做改变,这就是纳什均衡。

A和B怎样能够获得最大利润呢,就是A和B坐到一起商量,同时把价格提高,这就叫共谋,但法律为了保障消费者利益,禁止共谋。

所以有的企业会打出这样的横幅“我的价格一定不会比B低”,B是指竞争对手。意思是告诉对方,我会和你用同样的价格,所以你尽管定高价。显然这样的横幅也是共谋。

f46390d13c353a8176ec42fc63bf3c92.png

二、纳什均衡涉及到非合作博弈,这个事情我可以给你解释一下,大致就是用离婚这个事情来说吧。

夫妻2个人,要离婚的时候,一般情况下就是要分割财产。这时候,就是一个博弈过程。如果是合作博弈,也就是两个人好商量,那么就去协议离婚,民政局领离婚证,财产一人一半,谁也不吃亏。

但是,如果走法院起诉离婚的路线,则是非合作博弈,这个时候要请律师,而且财产分割就会有人吃亏有人占优势。

那么,我们假设夫妻财产是100万,如果女方请律师,上法院起诉离婚,那么女方要付出律师费4万,但可以赢得70万,男方如果不请律师,那么男方得到30万。这个情况下,男方其实是吃亏了。所以,这个不是纳什均衡——

所谓均衡就是无法再改进了,那么男方应该怎么做?当然是要改进,那就请律师,男方付出律师费4万,这个时候双方上了法院,最后律师势均力敌,双方每人50万,除了律师费用,每人剩46万。这个每个46万就是纳什均衡。

46bbd4b32d4981adb7cbb1da339281ab.png

所以,从上面的例子可以看出,两个人不请律师不是纳什均衡,因为女方如果知道男方不请律师,她肯定会请律师,最后得到70万。

所以,这个状态不是一个纳什均衡——因为有一方可以通过改进策略多赢钱。

最后双方非合作博弈的纳什均衡状态一定是双方都请律师,最后谁也不吃亏——律师赚了钱,所以律师在离婚官司里得到了纳什均衡的好处。

3、纳什均衡是博弈论中的一个规律,指的是在一个博弈过程中,博弈双方都没有改变自己策略的动力,因为单方面改变自己的策略都会造成自己收益的减少。纳什均衡点可以理解为个体最优解,但并不一定是集体最有解。

为了解释这个问题,我们举两个最典型的例子:囚徒困境和智猪博弈。

1)、囚徒困境

囚徒困境是说:有两个小偷集体作案,然后被警察捉住。

229d2e8efca4993426eda3bfd5df9b7e.png

警察对两个人分别审讯,并且告诉他们政策:

如果两个人都交代坦白,就可以定罪,两个人各判八年。

如果一个人交代另一个不交代,那么一样可以定罪。但是交代的人从宽处罚,批评教育就释放。不交代的人从严处罚,判十年。

如果两个人都不交代,没法定罪,每个人判一年意思一下。

两个人的收益情况如下所示:

f0472483f484c12aa59f7782a86089b1.png

首先我们考虑A的决策。

A会想,我如何才能获得更大收益呢?如果B坦白了,那么我坦白就会判8年,我抗拒就会判十年,我应该坦白;如果B抗拒了,我坦白会判0年,我抗拒会判1年,我还是应该坦白。

所以最终A会选择坦白。

同样,B也会这样想,因此最终纳什均衡点在两个人都坦白,各判八年这里。

显然,集体最优解在两个人都抗拒,这样一来每个人都判一年就出来了。但是,纳什均衡点却不在这里。

而且,在纳什均衡点上,任何一个人都没有改变自己决策的动力。因为一旦单方面改变决策,那个人的收益就会下降。

18cf04967e5f6cdcd7a4e1538a668da1.png

945a46a1066d7768492d98c90bc4b60d.png

这与我国开车加塞的例子很像。

如果大家都不夹塞,是整体的最优解,但是按照纳什均衡理论,任何一个司机都会考虑,无论别人是否加塞,我加塞都可以使自己的收益变大。

于是最终大家都会加塞,加剧拥堵,反而不如大家都不加塞走的快。

那么,有没有办法使个人最优变成集体最优呢?方法就是共谋。

两个小偷在作案之前可以说好,咱们如果进去了,一定都抗拒。如果你这一次敢反悔,那么以后道上的人再也不会有人跟你一起了。

也就是说,在多次博弈过程中,共谋是可能的。但是如果这个小偷想干完这一票就走,共谋就是不牢靠的。

在社会领域,共谋是靠法律完成的。大家约定的共谋结论就是法律,如果有人不按照约定做,就会受到法律的惩罚。通过这种方式保证最终决策从个人最优的纳什均衡点变为集体最优点。

11235761957c8915f2ca96d3e31ee910.png

 觉得好看,请点这里↓↓↓

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值