Spatial Evolution of Social Norms in a Common-Pool Resource Game

共同池资源博弈中社会规范的空间演化

简介。我们研究了空间公共池资源(CPR)游戏中合作的出现条件。我们考虑三种类型的代理人:合作者,叛逃者和执法者。执法者的作用是惩罚叛逃者过度捕捞资源。代理商位于一个圆圈上,他们只观察两个最近邻居的行为。他们的收益取决于本地和全球的互动,他们通过模仿平均最高平均收益的社区策略来改变他们的行为。通过理论和数值分析,我们发现平衡的大量多样性是游戏的结果。特别是,我们找到了三种策略共存的均衡发生的条件。我们还得出了这些均衡的稳定性。最后,我们表明在系统中引入资源动态有利于合作均衡的发生。
关键词:共同财产,合作,进化博弈论,地方和全球互动博弈,自组织

 

1.简介
公共池资源(CPR)游戏是研究社会困境的极好工具。 社会困境是一种追求个人利益而牺牲集体目标的情况。 在共同资源管理的背景下,与帕累托最优相比,这种社会困境导致过度开发和低效率。

人们的行为总是受自私行为的支配吗? 最近的证据使经济学家重新考虑他们对行为的假设。 在实践中,一定比例的人口往往表现出似乎与理性,自私的代理人观点相矛盾的合作行为。 当社会规范占上风时,这种行为尤为常见。 这些可以通过相互信任,奖励或惩罚的系统以分散的方式运作。

Ostrom(1990)收集了大量关于农村社区的案例研究,其中社会规范的存在导致了公共池塘资源的可持续管理。一个受到广泛关注的例子是缅因州的龙虾产业。在这个社区,渔民被分配了一个空间领域来传播他们的陷阱。为了增加他们的捕获量,搭便车者试图扩大他们的领土。然而,每个渔民都被允许使用不同程度的制裁来保卫自己的领土,从谴责到打开或摧毁自由骑行者的陷阱(Acheson 1988)。在其他情况下,停止合作而不是惩罚搭便车者也证明是有效的。例如,所罗门群岛的日本村民,爱尔兰渔民和居民选择与过度捕捞的其他社区成员断绝联系(Taylor,1987; McKean 1992; Hviding and Baines 1994)。通过这种方式,搭便车者被剥夺了其他经济活动合作所带来的好处。

在案例研究旁边,还有许多实验证据支持合作的持续性。 这篇文献太大,无法在这里进行评论。 Ostrom等人已经完成了研究工作。 (1994)和Fehr和Ga¨chter(2001)。 后一项研究表明,人口中通常只有一小部分“利他惩罚者”足以在该群体中加强合作。 Van Soest和Vyrastekova(2004)提供了可再生资源领域的应用。

由此得出的一个关键理论问题是:为什么合作行为首先出现? 与现实世界的证据相比,关于这一主题的理论并不多。 Fehr和Schmidt(1999)发展了一个不公平厌恶的理论模型。 他们假设一小部分人愿意牺牲物质收益,如果这会导致更“公平”和公平的结果。 Sethi和Somanathan(1996)讨论了Dasgupta(1993)所表达的观点,他提出了三种可能的解释。

1.小社区可被视为小型社区,有能力迫使社区成员接受行为规则。 Sethi和Somanathan(1996)并不认为这是一个有力的论据,因为它无法解释这样一个事实,即私人制裁可能是自发的,可能需要在州一级经常被禁止的破坏性行为。

2.重复博弈中的合理性可以与合作相协调。 这是众所周知的民间定理。 但是,这里的问题当然是潜在均衡结果的集合非常大,并且可能出现交替的合作和背叛时期,这与观察到的战略持续性相矛盾。

3.社会规范通过“社区生活,角色塑造,教育以及通过试验奖励和惩罚”而被内化(Dasgupta 1993,p.208)。 然后,他们可以激励代理人去做他们做的事情。

为了解决与解释2相关的问题并分析3下提供的解决方案,采用进化游戏设置是一个很有前景的选择。 通过追踪合作(和背叛)的演变,它可以帮助确定从动态和分解(人口)的角度来看,有或没有合作的假设均衡实际上是可行的。

解释或分析社会规范在资源环境中维持合作的作用的理论模型很少见。 Sethi和Somanathan(1996)的目的是使用进化博弈理论框架分析上面第3点提到的哪些规范可以内化。在他们的模型中,代理人可以在三种策略中进行选择:叛逃,合作或执行。选择成为执法者的代理商惩罚叛逃者,即使他们因此而付出代价。制裁程度和叛逃者和执法者承担的制裁费用取决于人口中的叛逃者和执法者的数量。收益与资源存量的大小有关,对于叛逃者(和执法者),与制裁(惩罚)成本水平有关。代理商可以通过社交学习过程随时间修改他们的策略。他们通过模仿在人口中获得高于平均利润的策略来学习。这是通过模仿人口中社会规范演变的复制动力模型来建模的。 Sethi和Somanathan确定了两个主要的均衡:一个仅由叛逃者组成的人口和一个仅由合作者和执法者组成的人口。

另一项关于社会规范在解决社会困境中的作用的理论研究是Eshel等。 (1998),他考虑了利他主义者和利己主义者之间的地方互动模型。 虽然他们没有处理资源,但他们仍然为我们的方法提出了相关的要素。 首先,他们假设代理人在他们的直接邻居中模仿具有最高平均利润的策略。 其次,他们能够得出一个设置的分析结果,其中代理在空间上分布在圆上并且仅与它们的两个最近邻居交互。

在本文中,我们考虑一种结合了本地和全球互动的空间进化CPR游戏。代理商可以是合作者,叛逃者或执法者,并模仿在其社区中产生高于平均收益的策略。我们就像在Eshel等人(1998)中通过假设一个只有观察他们两个最近邻居的代理的圆圈来模拟空间。这是一个逻辑概念 - 分析起点,同时它也提供了一个非常准确的图像,说明了在大范围的CPR问题中如何发生相互作用,例如灌溉问题。实际上,在许多经历水冲突的农村社区,水位配额的监测由位于水流上游或下游的农民施加(参见Ostrom 1990; Smith 2000),表明线性(或避免边缘问题的圆形)模型。与此相符,我们假设在我们的模型中,执法者只能惩罚位于其邻近区域的叛逃者,这意味着当地的互动。收益进一步取决于总收获努力和资源存量的演变,这意味着全球互动。换句话说,我们的模型结合了本地和全球的互动。我们推导出在这种系统中出现的极限状态类型的理论和数值结果。与以前的工作相比,我们获得了两项主要的创新成首先,三种策略共存的均衡在长期存在。其次,当引入资源动态时,促进了这种均衡和一般合作均衡的出现。

本文的结构如下。 第2节介绍了标准CPR游戏及其进化版本。 第3节列出了我们的模型在没有资源动态的情况下获得的主要结果。 第4节讨论了均衡的稳定性。 第5节介绍了资源动态的结果。 第6节总结。

2. CPR游戏

我们考虑三种代理人的表现:合作者,叛逃者和执法者。 他们玩游戏涉及利用可再生自然资源的共同池。 合作者和执法者应该表现出社会行为,这意味着他们限制了行使的收获努力水平。 然而,叛逃者只对自己的利润感兴趣,并且以相对较高的努力水平收获,从而可能伤害其他参与者。 为了更精确地考虑这些概念,我们在此简要介绍标准CPR游戏作为基准(参见例如Dasgupta和Heal 1979; Chichilnisky,1994;或Ostrom等1994)。 我们首先考虑没有资源动态的情况。 随后我们讨论自然资源随时间变化的情况。 然后我们介绍进化的CPR游戏。

2.1 标准CPR游戏

固定的n(n> 1)个代理群体可以访问公共资源池。 最初,我们假设池的大小随着时间的推移是不变的。 资源的开采导致收获。 代理i的个体努力水平由xi(i = 1,2,...,n)表示。 单独的努力成本用w表示。 总的努力是:

收获取决于个人和总体努力。 当总工作量为X时,总收获量等于F(X)。 假设F严格凹入并且增加,。 收获的商品被视为计价器。 每个代理商我收到的总收入份额等于他在总投入中的份额。 然后个人利润由下列人员给出:

总利润是:

帕累托效率,总利润最大化,努力程度由定义。 努力的零利润水平由定义。 对称纳什均衡聚合努力遵循

显然。 因此,纳什均衡不是最理想的,但产生了积极的租金。

在资源动态的情况下,社会最优可以用几种方式描述。 一种选择(连续时间)是考虑总利润现值的最大化

受制于

这里r是社会贴现率,N(t)表示时间t的资源存量,G是自然增长函数,F是收获函数,总体努力以及现有存量增加。 然后可以将社会行为定义为与从现值最大化相关的动态提取路径一致的行为。 纳什均衡是差异化游戏的解决方案,其中每个代理人都采用所有其他参与者的努力时间路径并最大化他自己的总折扣利润。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值