《合作的进化》 阅读笔记

💡 根据 遗忘曲线:如果没有记录和回顾,6天后便会忘记75%的内容

读书笔记正是帮助你记录和回顾的工具,不必拘泥于形式,其核心是:记录、翻看、思考

简介

书名

合作的进化

作者

罗伯特.阿克塞尔罗德

状态

已读完

简介

《合作的进化》使博弈论的经典制作,作者的一个重要结论就是人们互相作用越频繁,合作的可能性的越大。

思维导图

囚徒困境


囚徒困境是一个展示两个理性个体在没有沟通时往往无法达成最佳共同利益状态的博弈论模型。在这个问题中,如果两名嫌疑人都选择合作(即保持沉默),他们会得到较轻的处罚。但由于彼此不信任,每个人面临背叛对方(揭发对方)以求减轻自己刑罚的诱惑。最终,往往导致两者都选择背叛,结果比双方都选择合作时对每个人都更不利。这个模型说明了个体追求自身最大利益时可能导致的集体理性失败。

囚徒困境中的合作

罗伯特·阿克塞尔罗德在其著作《合作的进化》中通过计算机模拟的锦标赛形式,展示了以牙还牙策略如何在多轮的囚徒困境游戏中胜出,成为促进合作的有效策略。这项工作强调了即使在缺乏中央控制的情况下,合作行为也能通过简单的规则自然演化而来。

Tit for Tat (以牙还牙)算法


"Tit for Tat"(以牙还牙)算法是一种在囚徒困境游戏和其他博弈论场景中广泛研究的策略。这种策略非常简单但异常强大,它基于互惠原则运作,其基本规则如下:

  1. 首轮合作:在互动的第一轮中,采取合作(Cooperate)的策略。
  2. 之后模仿对手上一步的行为:在随后的每一轮游戏中,玩家将复制(模仿)对方在上一轮的选择。如果对手在上一轮中选择合作,那么在下一轮中也选择合作;如果对手在上一轮中选择背叛(Defect),那么在下一轮中也选择背叛

策略的优势
  • 互惠性:该策略基于互惠原则,即以同样的方式回应对方的行为。这促使参与者在长期互动中采取合作行为,因为只有通过合作,他们才能期望得到合作的回应。
  • 简单性和有效性:尽管这个策略非常简单(只基于对手的最后一次行为),但它被证明在多种情况下都非常有效,能够促进和维持合作。
  • 避免无限循环的报复:通过始终以合作开始,并只在遭受背叛后才背叛,以牙还牙避免了因报复和反报复而导致的无限循环。这种策略允许合作在双方愿意合作时重新建立。
  • 激励合作:通过奖励合作行为(通过合作回应)并惩罚背叛(通过背叛回应),它激励参与者遵循合作行为,即使面临短期内背叛的诱惑。
  • 条件性合作:以牙还牙是一种条件性合作策略,它使得合作的持续性依赖于对方的合作态度。这与无条件的合作(总是合作)或无条件的背叛(如All D策略)形成鲜明对比。

算法示例
import java.util.Random;

public class TitForTat {

    public static void main(String[] args) {
        int rounds = 50; // 游戏进行的轮数
        char player1Action = 'C'; // 玩家1的初始行动,以牙还牙策略从合作开始
        char player2Action;
        Random random = new Random();

        for (int i = 0; i < rounds; i++) {
            // 玩家2随机选择合作或背叛
            player2Action = random.nextBoolean() ? 'C' : 'D';

            System.out.println("Round " + (i+1) + ":");
            System.out.println("Player 1 (Tit for Tat): " + player1Action);
            System.out.println("Player 2 (Random): " + player2Action);

            // 以牙还牙策略:玩家1在下一轮复制玩家2的行为
            player1Action = player2Action;

            System.out.println();
        }
    }
}

读后感

观点1

“以牙还牙”是一个具有鲁棒性和稳定性的算法,但是在任何一局中它从来没有得到比对方多的分数!确实,它不可能在一局中比对方得分更多,因为它总是让对方先背叛,并且他从来不会比对方背叛的次数多。它的胜利,不是靠比对方做得好,而是靠引导出对方的合作。用这个方式,“以牙还牙”(或许用另外一个翻译更加贴切——“一报还一报”)靠促进双方的利益而不是靠剥削对方的弱点来取得胜利。

因此,在一个非零和的世界里,为了你自己做得好,你没有必要非得比对方做得更好,特别是你要和许多不同的对手打交道时更是这样。你只要自己能做得更好就让他们每个人做得和你一样活着略好些。没有理由去嫉妒对方的成功。因为在长时间的“重复囚徒困境”中,其他人的成功是你自己成功的前提。

观点2

职场中的合作也是不可逆的。在一些跨部门,甚至跨公司的沟通协作时,我们可能会碰到某一方交流不积极,甚至有意撇清关系的情况。在这种(总是背叛 All D)情况下,我们在初期互动中展示的合作行为可以积累信任,为建立稳定和长期的工作关系打下基础,我们也可以选择更换对接人,以寻求新的合作机会。(职场上的“以牙还牙”式的合作更多是建立在同级的基础上)

  • 28
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值