国外博弈逻辑研究述评

最新推荐文章于 2023-09-23 10:55:12 发布

人机与认知实验室

最新推荐文章于 2023-09-23 10:55:12 发布

阅读量883

点赞数

摘要: 博弈逻辑是博弈论与逻辑学相交叉的一个崭新的领域，它实际上研究的是参与者或行动者在互动过程中如何理性地选择策略和如何做出行动的逻辑。文章介绍了近年来博弈逻辑在国外的发展现状，梳理了博弈逻辑的发展脉络，针对现状展开分析，指出博弈逻辑目前的不足和将来的发展趋势。

关键词: 逻辑; 博弈; 动态

近十几年来，博弈逻辑的研究有了长足的发展。国外对博弈逻辑的研究基本上形成了两个学派，一是通过静态系统研究博弈逻辑；二是结合动态逻辑研究博弈逻辑。后一流派是当今博弈逻辑研究的主流。2000年以来，博弈逻辑的研究在多个方向上取得了新的进展，本文将着重对主流学派的约翰·范本特姆(van Benthem) 、波利(Pauly) 和帕里克 (Parikh) 、奥特罗(Otterloo) 等人的工作进行梳理，并予以介绍与评析。

一、范本特姆对博弈逻辑的研究

2002年他在《作为进程模型的扩展博弈》一文中以有穷双人博弈为主线，用带有匹配的互模拟概念的模态语言作为各种博弈均衡，从而分析了交互进程模型上的扩展博弈。文中的技术结果表明了怎样让现有的模态概念适用在这个新的设置中。最后给出两个主张:第一，扩展博弈是自然进程模型，不需要外来的新形式体系就可以支撑很多熟悉的模态逻辑。第二，互模拟分析作为逻辑进程理论的标志，可以应用于多种博弈结构中，为研究各种博弈均衡提供了正确的方法。

2003年他在《逻辑博弈对博弈逻辑是完全的》一文中，首先描述了逻辑赋值博弈中的一阶赋值博弈和模态博弈。第二将幂关系定义为一种广义的传递关系并证明这种关系具有单调性、一致性和确定性。第三给出了三个博弈运算: 选择，对偶和复合并利用这些运算定义了博弈语言及博弈模型，由此描述了动态博弈逻辑PGL，然后证明了博弈代数可公理化。第四证明了一般的博弈运算代数恰好与逻辑赋值博弈一致，而后者更具有一般性。第五证明了乘积博弈 G( H 具有单调性和一致性。

2003年他在《IF博弈的认知逻辑》一文中将 Jaakko Hintikka 的工作汇集成两个视角:博弈语义和认知逻辑来分析独立友好(independent friendly) ，简记作 IF 博弈，其目的是为了把逻辑和博弈二者联系起来。本文以博弈和逻辑的融合为出发点，介绍了一阶赋值博弈，独立友好博弈和不完全信息，从逻辑、博弈论、可能性和预期应用方面讨论了独立友好逻辑。最后他强调人们既可以通过标准的静态认知算子解释任何独立友好的著作，当然还可以通过旋转木马式地系统研究博弈，而独立友好逻辑为研究不完美信息逻辑和信息流逻辑提供了一个有吸引力的场所。

2005年他在《在逻辑和博弈中的开放问题》一文中首先指出:逻辑和博弈可以以几种不同的方式相互融合，如逻辑博弈和博弈逻辑。他认为: 论辩本身就是一种博弈，论辩双方可能会赢或输。在逻辑博弈中，除了语义或演绎基础外，有效性还具有一种类似于博弈中的获胜策略。而博弈逻辑是以分析博弈为目的而设计的逻辑系统。本文结合模态逻辑、博弈运算探讨了动态博弈逻辑，提出通过增加博弈对偶算子来彻底公理化动态博弈逻辑。不仅如此，本文还探讨了关于知识、信念和更新等问题。为了寻找一个更一般的可以确立系统均衡理论的认知特征的逻辑，随后作者探究了动态认知逻辑。最后，作者总结了他对逻辑和博弈论交界研究的最新方向和开放性问题。本文最大的特点是:贯穿全文，作者提出了40个有关在逻辑和博弈中的问题。如问题 20: 使用 DEL 去分析博弈论均衡的国外博弈逻辑研究述评各种不完全信息博弈概念。

2003年他在《IF 博弈的认知逻辑》一文中将 Jaakko Hintikka 的工作汇集成两个视角:博弈语义和认知逻辑来分析独立友好(independent friendly，简记作IF) 博弈，其目的是为了把逻辑和博弈二者联系起来。本文以博弈和逻辑的融合为出发点，介绍了一阶赋值博弈，独立友好博弈和不完全信息，从逻辑、博弈论、可能性和预期应用方面讨论了独立友好逻辑。最后他强调:人们既可以通过标准的静态认知算子解释任何独立友好的著作，当然还可以通过旋转木马式地系统研究博弈，而独立友好逻辑为研究不完美信息逻辑和信息流逻辑提供了一个有吸引力的场所。

2005年他在《作为互动的认知过程》一文中说明了很多认知活动都是不可避免的社交，包括在几个不同主体之间的互动。他给出了在语言交流和博弈中的一些认知活动的例子，并展示了逻辑方法是如何为相关信息流和世界改变提供精确的模型。最后，他在这篇文章中讨论了在逻辑计算方法和实验认知科学之间的可能联系。文章试图说明互动的社交认知现象是重要的，并且它们被赋予了足够丰富的逻辑-计算结构，这样就可以促进有趣的科学分析。他关注于个体能力的语言，模型化单个主体对语法的形式假设或对已观察现象的其他模型。他的另一个主要的观点是逻辑、认知和计算的三位一体，并确信这是一般的进行认知研究的途径。

2006年他在《博弈中的理性和承诺》一文中探究了将行动、偏好和期望混合在一起的逆向归纳法，他认为理性的人有很好的理由去行动，但是很难去发现这些理由是什么，它们又是如何运作生效的，因此他还讨论了在博弈中分析行为的三种情景。即人们可以将给定行动合理化为展现主体的偏好；人们也可以将它们合理化为展现主体对其他人的信念；但是人们还可以通过做出承诺改变行为的预测模式。所有这三种情景将给定博弈转换成一个新的博弈，作者还证明了关于它们作用范围的一些结果。相关博弈转换的一个更为一般的视角包含着动态和认知博弈逻辑。

2006年他在《信念修正的动态逻辑》一文中说明了在动态认知逻辑中增加条件信念算子后，如何系统地处理信念修正。文章的核心包括在可能世界间改变可置信关系的可定义的更新规则。文中的分析产生了两种模态新结果：一是基于合成的归约公理，作者为信念修正的具体机制获得了完整的逻辑；二是作者说明了信念修正的各种不同的抽象假设都可以用模型改变运算的标准模态框架对应来分析。

2007年他在《博弈中的理性动态和认知逻辑》一文中介绍说博弈论解决方案概念描述了在貌似合理的方面对所有玩家来说最优的策略组合集，这些集合经常可以在递归的算法中看到，如在策略博弈中对严格劣策略的迭代剔除，或者在扩展博弈中的逆向归纳。解决概念集的标准逻辑分析假设了玩家在给定的博弈的固定认知模型中，如理性的共同知识。在这篇文章中，作者提出了一个不同的视角，将解决算法作为学习的进程进行分析，这改变了博弈模型。因此，策略均衡就与合适的认知语句的迭代宣告的固定点运算产生联系。这种动态的立场在博弈、逻辑和计算的当前交界面上提供了一个新的视角。

2010年他在《心灵开放者的模态逻辑》一书中介绍了模态逻辑。模态逻辑诞生于20世纪初，作为逻辑学的一个分支它应用在哲学概念及问题的分析上。在书的第十七章作者介绍了模态逻辑与博弈，他指出信息与行动相遇的一个具体领域就是博弈，在这里玩家的策略涉及在时间上与其他玩家的动作之间的互动，并且只给出一些使模态逻辑牵涉其中的方法，而不试图给出系统的理论。作者介绍了作为进程模型的扩展型博弈，策略的动态逻辑，不完全信息博弈，偏好、理性、与解决博弈，博弈改变的动态逻辑。文中已经通过例子展示了模态逻辑是如何以一种自然的方式应用在博弈中，作者在扩展博弈上做工作，但是类似的方法也适用于一般策略混合博弈。

2011年他在《探索游戏理论》一文中探究了社交行动的逻辑基础近年来的一些方向，这些方向产生于逻辑、博弈论、哲学和计算机科学之间的联系。文章主要介绍了社交行动的逻辑、逻辑和博弈论、逆向归纳法的重新审视、深思熟虑创造信念、均衡和固定点逻辑、最佳行动的模态逻辑、极限现象的逻辑、逆向归纳法的矛盾、理性、偏好改变与博弈改变，最后谈及了游戏理论的影响。

2011年他在《社交环境中的逻辑》一文中关注博弈，特别是逆向归纳法。沿着这一线索促发了在初期的社交行动中的重要问题。作者的目的不是在博弈逻辑中给出新的技术性结果，而是去解释导向问题，用更宽广的推力去识别开放性问题，为哲学细究提供全神贯注和预设。

2014年他在《博弈中的逻辑》一书中将博弈逻辑划分为两个宽博的论题，一方面是博弈中的逻辑，另一方面是作为博弈的逻辑。该书的Ⅰ－Ⅲ部分覆盖了前一主题，Ⅳ－Ⅵ部分覆盖了后一主题。该书是对博弈逻辑领域内研究的综述。每一章节都以对近期文献和将来研究方向的总结作为结尾。该书的目的是为了提供给读者一个对于分布式研究的清楚的、详细的和整体的涵盖，而不是为了发展或辩护一个特定的主题或论证。书中大量的技术性证明都通过进程图/博弈树来进行。序章为读者介绍了进程图/树的细节并进行了清楚的命名，并指出尽管书中章节之间都是相互独立的，但它们并不是内容完全分离的。该书的第一部分包含1－6章，涵盖了博弈逻辑和进程结构第二部分包含7-10章，在这里逻辑动态问题开始成为关注的焦点。第三部分包含第11－第13章，介绍了策略博弈和玩家用以影响或力迫他们所玩博弈的结果的权力。第四部分包含第14－第18章，用范本特姆自己的话来说，是“本书改变内容和样式的转折点”。前述的第1－第13章是对博弈的逻辑分析，接下来的第14－第23章是对逻辑作为博弈的理解。这一部分检测了逻辑博弈对于形式化赋值，比较和构造模型的不变性。第五部分包含第19－第20章和第六部分包含第21－第23章，第六部分扩展了第五部分的工作，探索了博弈的逻辑分析与逻辑的博弈方面之间的交叉。该书最后一章是以哲学上比较吸引人的方式进行的描述，本质上是一种试探性的推测。

二、范本特姆与他人合作对博弈逻辑的研究

2005年范本特姆、奥特罗和罗伊( Ｒoy) 在《博弈中的偏好逻辑，条件句和解决概念》一文中说明了偏好逻辑领域研究的是表达和分析世界、动作或命题之间偏好概念的形式系统，文中作者采用了一种更为简便的方法去设计明晰又具有低复杂性的语言。由于偏好是世界之间的二元关系，它们自然也支持标准的一元模态词，其中，关键模态词 ◇ φ仅仅是说φ在至少和当前世界一样好的某些世界里为真。作者给出的模态语言可以表达命题之间的许多偏好概念，甚至它还可以拆解条件句，将条件句逻辑嵌入到标准模态逻辑中。此外，作者还用模态语言来分析博弈。作者展示了一个定性的一元偏好模态词是如何满足策略博弈中纳什均衡的定义，又是如何满足有限扩展博弈中逆向归纳解决的定义。接着，从一个技术性的角度，在偏好模态词显露出它的真实表达力之前，文中考虑到的每个应用都为世界建议了一些额外的访问方式。出于这个目的，作者从现代文献中找到了多方面的附加概念:全称模态词、混合逻辑算子、命题动态逻辑中的行动模态词、个体模态词、从认知逻辑中分布知识。最后，文章的重心完全放在了表达力上。

2008年范本特姆、高希( Ghosh) 和刘奋荣在《模型化动态逻辑中的同时博弈》一文中关注平行博弈中的同时博弈，在抽象化能力的层面上形式化同时博弈，将序贯博弈(是指参与者选择策略时间先后的博弈形式。因此，某个主体可能率先采取行动，它是一种较为典型的动态博弈，重复博弈可以视为一种特殊的动态博弈形式)的动态逻辑和同时动态逻辑相结合。作者在文中通过有限不确定博弈证明了同时博弈逻辑CDGL系统的完全性，还说明了这个系统如何引发新的问题，并为一阶逻辑的分支量词和IF赋值博弈提供线索。

2011年范本特姆、帕奎特(Pacuit) 和罗伊在《面向游戏理论:以一种博弈和互动的逻辑视角》一文中说明逻辑和博弈论的结合为信息和互动的动态提供了一种细腻的视角。行动、偏好和策略是计算机科学和哲学逻辑中的中心概念，它们的结合也引发了关于可定义性、公理化和可计算复杂性方面的有趣问题。认知博弈论，为这一混合增加了一个新的元素:事实信息和高阶信息。文中作者从动态逻辑的视角出发，将社交情景理解为一种进程即参与者交互式地修正他们的信念，改变他们的偏好和策略。文章的第一、二部分作者铺设了理论的主要成分，且利用了近年来在行动、偏好和信息的逻辑动态方面获得的进展。在第三节和第四节作者说明了用细粒的视角如何阐明信息交换的长期动态，还阐述了扩展博弈合理行动的问题。最后总结了逻辑和博弈论之间的关系，整篇文章具有介绍性和纲领性。

三、波利等关于博弈逻辑的研究

2003年波利和帕里克在《博弈逻辑综述》一文中指出: 博弈逻辑是一种模态逻辑，它通过总结语义并增加新的算子对命题动态逻辑进行扩展。文中给出了博弈逻辑的语法和语义还有克里普克模型，指出互模拟的概念是模态和动态逻辑过程等价性的中心概念。他们提供了关于博弈逻辑元理论结果的综述，探讨了博弈逻辑的公理化以及系统的完全性、可靠性、可满足性和模型检测等问题，通过实际应用指出博弈逻辑可以被用来推理确定的二人博弈，最后对博弈代数进行了综述。

2007 年，波利和范德胡克(van der Hoek) 在他们的文章《博弈和信息的模态逻辑》中介绍了模态逻辑在博弈论中的应用并指出: 博弈论的思想在逻辑上有着悠久的历史。量化的博弈论解释至少可以追溯到皮尔士(Peirce)，随后，研究者定义了博弈版本的所有基本的逻辑概念(在一个模型中的真，有效性，模型的比较)。虽然，博弈论与模态逻辑之间的关系最近才开始研究，但这种研究十分活跃。这篇文章还强调:博弈树可以被看作克里普克模型，在那里可能的行动被一种可达关系和关于收益与转换的信息由原子命题编码模型化。结构等价的概念，如互模拟那时已经转变成博弈均衡的概念，并且我们可以研究模态语言的扩展使得在这种扩展的模态语言中可以研究博弈论解概念，如子博弈的完全均衡。

四、其他学者关于博弈逻辑的研究

2004年奥特罗、范德胡克和伍尔德里奇( Wooldridge) 在《博弈逻辑中的偏好》一文中介绍了带有偏好的博弈逻辑(GLP) ，GLP可以让我们对主体如何使用关于其他主体的偏好的信息和假设来实现他们自身的偏好的推理成为可能，还可以被用来分析如投票或公平分割问题的社交机制；作者用许多处理过的例子解释了GIP的用处，接着证明了GLP的模型检测问题是易于处理的，描述了逻辑的一种有效的模型检测—通过使用模型检测，可以实现社交机制的分析和证明的自动化。在文中作者以一种常见的博弈形式开始，使用逻辑假设去展现不同的偏好结构。作者还指出使用GLP可以让我们只用偏好的部分信息去推理主体之间的交互过程，让我们能够对主体的偏好做出假设，接着再表达出假设的结果。特别的，作者感兴趣于这样的问题：关于其他主体偏好的新增信息是如何影响主体们的策略和联合的。文章的第二部分定义了文中用到的一些博弈论概念。第三部分定义了逻辑GLP，它可以用来表达社交机制的性质。第四部分通过一些案例解释了GLP的用处。第五部分，文中给出了对GLP的性质进行赋值的有效算法，通过Java模型检测描述了上述算法的执行和实施。

2011年阿格特尼斯(Agotnes)和范迪特马什(van Ditmarsch) 在《他们会说什么?——公共宣告博弈》一文中指出动态认知逻辑描述了对主体来说可用的可能信息变化的动作，还有他们的信息前后条件，例如，公共宣告逻辑描述了公共形式下的动作，真实的宣告。然而到目前为止很少有研究考虑描述和分析这些动作之间的理性选择，预示了自我本位的理性玩家实际上将要做的选择和应该做的选择。由于信息互换最终依赖于系统中所有玩家选择的动作，并且假设了玩家在这样的结果上有偏好。作者认为一个有趣的研究方向是在理性信息交换的研究中合并逻辑和博弈论。文中作者考虑的情况有公共宣告的可选行动，每个玩家在他想要为真时有一个认知目标公式。每个玩家会宣告什么?目标公式的真依赖于其他主体做出的宣告。作者分析了这样的公共宣告博弈。文章大体上有两个目的：首先，作者旨在通过博弈论视角分析DEL来合并逻辑和博弈，不仅描述可以发生的行动，而且还描述将要发生的行动。其次，作者假设了行动都是公共宣告，着眼于策略博弈并用逻辑目标公式表现偏好。在文章的第二部分，作者回顾了公共宣告逻辑的语法和语义学还有博弈论的一些概念。在第三部分，文章介绍了认知目标结构EGS的模型，并且将公共宣告博弈和EGS中的每个状态联系起来。一个特别有趣的个案是当一个或多个目标公式都是正的(positive) 。在第四部分，作者讨论了关于优势策略的相关概念。第五部分讨论了纳什均衡的概念并且介绍和将EGS视为策略博弈的方法。

2011年洛里尼(Lorini)和莫山(Moisan)在《扩展博弈的认知逻辑》一文中提出在扩展型博弈中展现互动玩家的逻辑框架结构，由于此类博弈中时态的重要性，他们构造一个模态认知逻辑，可以在博弈树中量化策略和顶点。文章第一部分介绍了对逻辑语言的定义和它的语义。为了解释该逻辑的应用，他们在接下来的部分定义了在扩展型博弈中理性的概念和逆向归纳法的概念。基于这些定义，文中提供了对奥姆(Aumann)定理的语法证明。最后，他们为证明该定理所需要的假设做了一个彻底的形式分析。

2013年普拉策(Platzer)在《对混合博弈的不同博弈逻辑的完全公理化》一文中介绍了微分博弈逻辑DGL，也就是基于结合离散和连续动态的混合系统的博弈。和混合系统不同，混合博弈允许拥有不同目标的不同玩家在系统动态中对抗性地解决选择。逻辑DGL可以被用来研究这类混合博弈中获胜策略的存在。作者介绍了一种简单的可靠且完全的公理化，涉及微分方程的固定点逻辑，证明了混合博弈的获胜区域需要更高的闭包序数，确定了分离公理也就是将混合博弈从混合系统中区分出的公理。

五、结语

参考文献:略

本文摘自《贵州民族大学学报(哲学社会科学版)》2017.5

作者：李娜，女，河南开封人，南开大学哲学院教授 ; 陈安琪，女，江苏连云港，南开大学哲学院硕士。

640?wx_fmt=jpeg