如何走出囚徒困境?

今天看了《策略思维》一书中的“走出囚徒困境”一章,有小感如下:

囚徒困境是非零和博弈中具有代表性的例子,反映了个人最佳选择并不是团体最佳选择(接触过编码的同学在解决最优路径的问题的时候经常会使用局部最优来促使整体最优的方法,但其实大家都了解经常不会得到整体最优的解法)。

囚徒困境:两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱五年;若互相揭发,则因证据确实,二者都判刑两年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。

针对以上的案例,我们知道其实最好的选择就是两个人都不揭发对方,将使得两人获得最好的结果。如果我们把同样的想法用于商业中,假设两个商家都不降价各自能够获得100w的收益,而其中任一商家降价的话,降价的商家获得120w的收益而不降价的获得80w的收益,最后一种情况就是两者都降价,两者都将获得80w(如下展示)。此时由于考虑到对方可能会突然降价,因此最终的策略肯定是两个商家都降价,而此时两者均只能获得80w的收益,比起两者都不降价100w的收益要少了20%。

 0        -1

0 100,100 80,120
-1 120,80 80,80

针对上述案例,我们要如何解决呢?
其实在现实中大家都能意识到存在这样的“囚徒困境”,因此会成立各种各样的商会、商业组织等等,通过商会或者组织的协调以谋求整个行业的收益最大化,但是因为人性的贪婪,总会有人想要去“作弊”,去突然调整自己的策略从而获得更多的收益, 其实这才是我们应该重点关注的问题,如何保证没人“作弊”呢?

只有利益,是我们决定使用何种策略的唯一标准,因此当发现作弊之后,“以牙还牙”的策略是经过验证(密歇根大学政治学学者罗伯特·阿克塞尔罗德指出)能够取得最后囚徒困境胜利的策略,也就是当有人“作弊”,那下一步就模仿他的策略执行,以实现对作弊的“惩罚”,这样的“惩罚”会促成新一轮的合作,而如果又作弊,那么肯定又可以通过“以牙还牙”的“惩罚”促成新一轮的合作,长期来看,这个策略能够实现一半合作,一半作弊

“以牙还牙”策略的一个替代策略
(1)第一印象,第一轮就背叛则直接转向以牙还牙策略
(2)短期:任何3轮当中出现两次也不可接受,直接转向以牙还牙策略
(3)中期:过去20轮当中出现三次背叛也是不可接受的,转向以牙还牙策略
(4)长期:过去100轮中出现五次背叛也是不可接受,转向以牙还牙策略

对于囚徒困境,个人认为“惩罚”是一个很好的打破困境的方式,而且在利益至上的氛围中,甚至可能是唯一的方式,而最关键的部分在于针对怎样的情况选择“惩罚”?如何确定“惩罚”的力度?惩罚之后的期间设置观察期,当观察期还是作弊,并且作弊次数超过已定的阀值,那就应该采取更严厉的“惩罚”措施,当然具体问题需要具体分析。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值