《合作的进化》读书笔记

随着最后一个暑假的结束,新学期的来临,我的学生生涯也快要宣告结束,但学习的脚步却是不会停下的。

这里写图片描述
(真是一个漂亮的地方,也许,一本书,一杯茶,一古堡,两个人,便可度余生)
照片出处:http://folletodelena.lofter.com/post/3b1fa4_c466e54

前段时间一直在忙着一些琐碎的事情,身心的疲倦让我难以静下心来走进经典的殿堂。今天终于有空花上一两个小时看书,看的是《合作的进化》,一本被誉为行为领域(文化领域是人文和艺术学科研究的对象,比如文学、艺术学、历史学、宗教学、哲学研究的领域等;行为领域是社会科学研究的对象,比如社会学、政治学、经济学、心理学、人类学、法学、教育学、军事学等研究的对象领域;自然领域是自然科学研究的对象,比如物理学、化学、天文学、地球科学、生命科学等研究的对象领域.一般而言数学、符号学、形式逻辑学、形式语言学、理论计算机科学视为形式科学,研究的是形式结构,并不是存在于客观世界的对象,所以不应该视为自然领域,他们更像是某些特殊的文化领域,可以称之为符号领域或形式逻辑领域)的经典之作。不过就看了两章,分享一些心得,接下来会不断更新:

第一章 合作的问题
本章可以说是整本书想要解决的问题的一个引子,也是书中将使用的基本研究方法的一个引子。本书想要解决的问题是什么呢?在文中第一段即做出了说明:在什么条件下才能从没有集权的利己主义者中产生合作?在当下,小到个人,大到国家,都存在冲突矛盾,也有合作共识,总的来讲,不管是冲突还是合作,可以说都是由于利益所导致的,冲突是因为某一方面或者双方都觉得自己得不到相应的利益,合作是因为双方都认为可以获利。表面上看来,合作会带来利益,合作自然是好的。但是,在某一次策略当中,背叛可能会带来更多的利益,由于这样的利益驱使,合作就变得艰难了许多,甚至,双方不再合作,只有冲突,虽然大家都知道只有合作才能带来最大的利益,但是由于猜不透对方的想法,谁也不愿意选择合作的时候被对方背叛而带来利益的缺失。那么,如何才能够较好的解决这样两难的问题呢?如何选择合作还是背叛?如何带来利益最大化?由此,作者提出了本书的基本研究方法:著名的“囚徒困境”游戏(两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱五年;若互相揭发,则因证据确实,二者都判刑两年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。)

第二章 合作的出现

本章作者主要对参与“囚徒困境”计算机竞赛的一些程序进行分析,并且对几个有创意的想法进行了分享。以下是作者对整个比赛的一些总结:

1、胜利者。在这场比赛当中,最终胜利的程序的长度是最短的,思想是最简洁的,那就是“一报还一报”(tit-for-tat)。第一次时选择和对方合作,之后根据对方上次的选择做出回应,如果对方上次背叛,则本次选择背叛,如果合作则继续合作。

2、胜利者的特点。作者总结出一个赢得“囚徒困境”游戏的程序的特点,那 就是“善良性”,即从不首先背叛,特别是当两个善良的程序遇到一起时,将会使双方都获得更大的利益。

3、一些有趣的思路
(1)如果对方不对自己的行为作出反应(背叛)的话,就试着背叛,如果对方反应的话,就合作。为了判断对方的反应,程序会估计对方在它合作之后合作的概率以及背叛之后合作的概率,如果这两个概率很相似,那么程序就会选择背叛,因为似乎对方不管自己合作还是背叛都做出同样的事情。当然如果对方倾向于合作之后合作而不是背叛之后合作,那对方就是有反应的,此时最好的选择就是合作。在刚开始时,可以假设两个条件概率值是0.5,但此时应该选择合作而不是背叛,因为在2中得出的结论是,善良性往往更容易获得胜利。

(2)面对“一报还一报”,采用偶尔背叛并且如果对方背叛自己立即背叛的方式会取得一丁点儿的胜利,但是最终双方的结果都会很差!

(3)“两报还一报”在有时比“一报还一报”得到更好的结果

(4)“检验者”的方法:第一步背叛,如果对方回应则接下来合作,然后采用一报还一报。如果对方不回应,那就在第二三步合作,但是之后每隔一两步就背叛,但是从不连续背叛两次。

4、总结
“一报还一报”的稳定成功的原因是它综合了善良性、报复性、宽容性和清晰性。它的善良性防止它陷入不必要的麻烦,它的报复性使对方试着背叛一次后就不敢再背叛,它的宽容性有助于重新恢复合作,它的清晰性使它容易被对方理解,从而引出长期的合作!

第三章 合作的建立
本章开篇指出策略入侵的具体情况:如果变异的个体干得比群体平均要好,那么就可以说该个体使用的策略可以实现入侵!当然,如果一个策略不能被其他策略入侵,这个策略就是集体稳定的!
紧接着作者介绍了几个命题:
命题2:当且仅当w(折扣系数,相对于前一步的重要性)足够大时,“一报还一报”是集体稳定的。且w的临界值是四个收益参数T、R、P和S的函数。
命题3:只有当w足够大时,任何可能首先合作的策略才可能是集体稳定的。
命题4:对于善良的策略,如果是集体稳定的,它就必须能被对方的第一个背叛所激怒。
命题5:“总是背叛”策略总是集体稳定的。
命题6:能以最小p值的一个小群体侵入“总是背叛”的策略是那些具有最大识别力的策略,如“一报还一报”。
命题7:如果一个善良的策略不能被单个个体入侵,那么它也不能被这类个体的群体入侵。

第四章 第一次世界大战堑壕战中的“自己活也让别人活”的系统

1、它是如何开始的?

前线的士兵直接通过叫喊后者信号来安排休战
基于特定天气(不能进行大规模进攻)的休战

2、它是怎么持续的?

双方都会努力证明克制,合作不是由于软弱,背叛只能回自我伤害
比如,德国的士兵通过射击一些小屋墙上的黑点直到把它们打成洞显示自己的威力

又或者,在每天某个特定的时间攻击同一个地方无人的地方,不仅给对方发送停战的信号,又向上级证明发动过攻击

3、为什么到战争后期会破裂?

司令部组织的小部队(10-200人)的突然袭击导致了整个系统的崩溃
因为双方都不再确定是否还会有下一次这样的突然袭击,没有了信用基础的保证之后,系统自然崩溃。

4、为何是一战中的堑壕战的特征,而不是其他战争

第五章
这一章是作者的一篇论文的缩写,所以有的内容偏生物学专业知识,所以有些地方看起来还挺吃力的。可以说,这一章主要讲的就是在生物系统中存在的合作进化的形成原因,稳定条件等等,相似的,也可以验证一些社会情况。

第六章
这一章是作者再通过实验结果的分析对比之后针对其中的问题或者针对其中得出的思考提出的一些建议,非常重要的一章,作者在本章中主要对处于“囚徒困境”的个人提供建议:
1、不要嫉妒
不要嫉妒是说不要嫉妒你的当前对局的对手,不要想要比他获得更多,因为在很大程度上(特例除外,但人处社会,存在各种各样的社会关系)你的对手不止一个,如果只是为了赢得对手,那会有以下几个损失:(1)你想赢得对手的同时对手也想要赢得你,导致你们相互背叛,共同取得的利益最小化;(2)你与对手的交手记录很有可能被其他对手知道,从而以后与别人的对局当中,相互背叛的概率将会变得很大, 你能取得的利益将会减少
2、不要首先背叛
作者的实验结果表明,善良的策略将能够取得更好的结果,所以,不要首先背叛。理由在于,面对善良的策略可能会略占上风,但是面对非善良的策略,损失也将会是很大的
3、对合作与背叛都要给以回报
为什么要回报?可以说这是策略的交流,也就是说表明你自己的策略——“一报还一报”,让对手清晰地了解到你的策略,从而让对手对你保持信任(双赢),同时也保持敬畏(惩罚)。
4、不要耍小聪明
耍小聪明会让你的对手对你失去信任,从而偏向于对你采取惩罚的策略,结果将会更差!

第七章 如何促进合作
本章作者主要是从一个改革者(改变合作方式)的角度来看问题,探讨了如何通过改变策略的环境本身,来促进合作:

1、增大未来的影响
如果未来对于参与者来说没有那么重要,甚至他不考虑未来的话,那么他就很可能采取背叛来获取高额利润。
具体来说,作者提出了两个基本的方法:
一是使相互作用更持久, 二是使相互作用更加频繁。

2、改变收益值
让合作的长期激励大于背叛的短期激励

3、教育人们相互关心
当构建了一个关心他人的社会,那么即使遇到“囚徒困境”,成员之间也更加容易达成合作

4、教育人们要回报
“一报还一报”是相对来说最好的方式,它的基础就在于,对对方所做的行为予以回报

5、改进辨别能力
一定要能够通过对方的行为记录挖掘出它的策略,才能够更好的进行合作

第八章 合作的社会结构
本章是作者基于“囚徒困境”策略的又一个升华,或者说对前文提到的关于群体入侵的观点的一个拓展。本章主要探讨了社会结构的附加形式,讨论四个能够引起有趣的社会结构形成的因素:标记、信誉、管理和领地。

第九章 回报的鲁棒性
进化的机制不必是生与死的问题,对于有智能的对策者,一个成功的策略能更经常的在将来出现,是因为其他人转变过来采用这个策略。这种转变或多或少可以是对成功者的盲目模仿,或者是基于有意识的学习过程。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值