在这里,我想用博弈论的“囚徒困境”模型来试着得出我们感兴趣的答案。
Part I
什么是囚徒困境?
- A认罪,B认罪,双方都判三年;
- A认罪,B不认罪,A判5年,B释放;
- A不认罪,B认罪,A释放,B判5年;
- A不认罪,B不认罪,双方都判1年。
收益矩阵如下:
| 不认罪 | 认罪 |
不认罪 | -1,-1 | 0, -5 |
认罪 | -5, 0 | -3,-3 |
现在我们总结一下“囚徒困境”的基本形式:
(1)我们考虑是否改变一下数字大小,结果就会不一样呢?主要保证矩阵中S>T>P>R,无论数字改成多少都不会影响最后结论。
| 合作 | 背叛 |
合作 | T,T | S, R |
背叛 | R, S | P,P |
(2)对方在这轮对局中采取的策略你无论采取任何方式都无法知晓。
(3)不能消灭对方,也不能放弃选择,只能在合作或者背叛两种策略里选择一种。
Part II
那么这个囚徒困境模型与我们要讨论的合作问题有什么关系?
我们回到“囚徒困境”来试着验证这个猜测是否合理。这里我们需要改变的是,使得双方的接触有无限多次,那么我们处理这个问题自然会使用下一步的收益成为当前收益的一部分的办法,权重设为w。假设,在无限多次接触中,双方都选择背叛,那么收益为p,总收益M=p(
对M求导,M在(0,1)上是增函数。那么他的现实意义是未来对现在的影响越大,收益越高。换句话说,如果我们有足够的远见能预测到未来我们仍有机会合作的话,那么你是否还会采取背叛的策略?商人的行为就是一个很好的例子。
Part III
结论: