行为决策演化示意图。最上面一行是混合群体,下面两行是网络群体。相比于混合群体,网络促使合作者聚集成团簇,但是惩罚的加入将破坏合作环境。
来源:中国科学院
西安光机所李学龙研究员同合作者在数据驱动的行为决策研究方面取得阶段进展。最新成果以“Punishment diminishes the benefits of network reciprocity in social dilemma experiments”为题,于2017年12月20日在线发表在《美国科学院院报》(PNAS)。
现实社会中,人们往往面临各种社会、经济、科技和军事等问题,如国家间的博弈与冲突、贸易谈判与贸易制裁、网络攻击、科技竞争、群体对抗等(这些问题被统称为困境问题)。这些问题往往很难找到合理、有效的解决办法,给人们带来许多的困惑和无奈。然而,现实经验表明:个体通过互相合作可以解决这些困境问题。因此,如何在竞争激烈的环境下维持稳定的群体合作(因为单个个体处于劣势)成为解决困境问题的关键所在,这引起科学家分别从自然科学不同领域来思考这一问题(如数理科学家从合作动力学的角度,信息科学家从合作优化的视角,生物学家从合作演化的角度等),也是使之成为自然科学领域持续关注的一个研究热点(2005年被Science列为25个最重要的科学问题之一)。
借用博弈框架,他们设计了混合群体(也称为非网络群体,即每个个体可以和所有个体等概率的进行博弈,因此个体相互作用网无固定的拓扑)和网络群体(即个体相互作用的搭档是固定的,呈现特定的网络拓扑结构)两种行为决策环境,并邀请300多名志愿者参加匿名实验。每名参与者可以选择合作、非合作两种策略,并反复进行博弈以产生行为决策的结构化数据。
研究结果表明,相比于混合群体,网络群体能够有效地促使处于劣势的合作者聚集成团簇(如图),从而维持稳定的合作水平,使群体获得较高的收益。这一现象被称为网络互惠(network reciprocity),这也是国内第一次通过行为实验证实网络互惠对解决社会与技术困境问题可提供可行的帮助。研究进一步发现,如果将惩罚作为第三种策略引入网络群体,这种新的策略选择将会在一定程度上破坏已形成的合作团簇,从而降低网络互惠的功效。
这一研究成果具有重要的现实意义,对解决社会、科技、军事问题可提供一定的科学依据。当前,网络暴力频发、交通拥堵令人担忧、教育资源日趋紧张、无人系统混乱等,人们寄希望于个体的相互合作来解决这些困境问题。例如,交通问题中,在既定的交通道路和导航信息环境下,个体只有自觉地通过人类作用网络自组织形成合作模式(如文明并道、礼让红灯等)方可从根本上解决拥堵问题。在此环境下,应慎用惩罚策略,从而避免打破人类作用网已形成的合作范式。此外,这一研究对理解和解决当前国际事务中的经济困境问题也可提供一定的借鉴作用。例如,国际贸易的发展使得世界各国在贸易领域建立了固有的网络联系,有效的促进了全球贸易的发展。当一国为了自身利益启动对他国的贸易制裁时,必然引发对方的反制裁和对抗;我们的研究表明这种惩罚措施的加入会破坏原有的合作模式,不但不能促进合作,反而会减少双方的收益,从而降低全球贸易水平。
因此,在解决面临的困境问题时,双方应以合作、协商的方式找到解决问题的途径,而慎用惩罚手段,才能有效维护社会的和谐、稳定和健康发展。
PNAS是《美国科学院院报》(Proceedings of the National Academy of Sciences of the United States of America, 缩写。它是美国国家科学院的院刊,亦是公认的世界四大名刊(Cell,Nature,Science,PNAS)之一,百年经典期刊。自1914年创刊至今,PNAS提供具有高水平的前沿研究报告、学术评论、学科回顾及前瞻、学术论文以及美国国家科学学会学术动态的报道和出版。PNAS收录的文献涵盖医学、化学、生物、物理、大气科学、生态学和社会科学,2014年最新发布的影响因子为9.803,特征因子(Eigenfactor) 为1.6033(2011)[1-2] 。
AI先锋
ID:EnlightAI
关注人工智能行业发展,介绍人工智能技术与产品