Multiagent Systems ——Algorithmic, Game-Theoretic, and Logical Foundations（多智能体系统——算法、博弈论与逻辑基础）

最新推荐文章于 2025-04-17 10:31:30 发布

sooAnderson

最新推荐文章于 2025-04-17 10:31:30 发布

阅读量1.3k

点赞数 24

文章标签：算法

本文链接：https://blog.csdn.net/subin0403/article/details/134809341

版权

一、作者：

Yoav Shoham
Stanford University

Kevin Leyton-Brown
University of British Columbia

二、书籍简介

想象一下，一款个人软件智能体代表您从事电子商务。假设该智能体的任务是跟踪一段时间内在各种线上场所可供销售的商品，并代表您以具有吸引力的价格购买其中一些商品。为了取得成功，您的智能体需要体现您对产品的偏好、预算，以及您对其运行环境的总体了解。此外，智能体需要体现您对其与之交互的其他类似智能体的了解（例如，可能在拍卖中与之竞争的智能体，或代表店主的智能体），包括他们自己的偏好和知识。这样的智能体集合形成多体系统。本书的目标是将各种想法和技术整合到一个体系内，提供多智能体系统建模、推理和构建的基础。

有点奇怪的是，对于一本声称严谨的书来说，我们不会给出多智能体系统的精确定义。原因是，过去曾提出过许多相互竞争、相互矛盾的答案。事实上，即使是看似更简单的问题——什么是（单一）智能体--拒绝给出明确的答案。就我们的目的而言，以下松散的定义就足够了：多智能体系统是指包括多个自主实体的系统，这些实体要么信息不同，要么利益不同，或者两者兼而有之。

2.1 本书范围

研究多智能体系统的动机通常源于对人工（软件或硬件）智能体的兴趣，例如生活在互联网上的软件智能体。事实上，互联网可以被视为自利的分布式计算实体之间交互的终极平台。此类智能体可以是上述类型的交易智能体、促进用户与各种计算资源（包括其他接口代理）之间交互的“接口智能体”、在多人游戏中帮助（或取代）人类玩家的游戏智能体，或在多机器人环境中的自主机器人。然而，尽管这些材料是由具有计算敏感性的计算机科学家编写的，但它是跨学科的，而且这些材料总体上相当抽象。许多思想适用于——事实上，它们经常取自——关于人类个体和机构的询问。

这些材料涵盖了计算机科学（包括人工智能、理论和分布式系统）、经济学（主要是微观经济理论）、运筹学、分析哲学和语言学等多种学科。技术材料包括逻辑、概率论、博弈论和最优化。所涵盖的每个主题都很容易支持多本独立的书籍和课程，本书并不旨在取代它们。相反，我们的目标是从每个学科中收集最重要的元素，并将它们组织在一起，平衡而准确地介绍这个广阔的领域。目标读者是计算机科学的研究生或高级本科生，这是典型的，但不是必须的。

由于多智能体系统的保护伞是如此广泛，因此在任何关于该主题的书中包含什么以及如何组织所选材料的问题都是至关重要的。首先，这本书专注于基础主题，而不是表面应用。尽管我们偶尔会参考现实世界中的应用程序，但我们这样做主要是为了澄清所涉及的概念；尽管之前公开了实际动机，但情况依然如此。因此，对于那些对构建这种或那种软件的实用指南感兴趣的读者来说，这是错误的参考书。重点是重要的概念及其背后的基本数学。目的是深入研究每个主题的详细细节，以便能够处理一些技术材料，然后为读者提供关于特定主题进一步教学的正确方向。

因此，我们的决定是包括主要建立的、严格的材料，这些材料可能经得起时间的考验，并在适当的情况下强调计算观点。这仍然给我们留下了大量可供选择的材料。在理解这里的选择时，记住以下关键词是有用的：协调、竞争、算法、博弈论和逻辑。这些术语将有助于构建以下章节概述。

2.2 章节概述

从协调问题开始，我们从第1章和第2章开始讨论分布式问题求解。在这些多智能体环境中，不存在智能体个人偏好的问题；有一些全局问题需要解决，但出于这样或那样的原因，在多个代理之间分配任务是必要的或有利的，这些代理的行为可能需要协调。因此，这些章节具有很强的算法性。第一个研究分布式约束满足问题。后者涉及分布式优化，并专门研究了四种算法方法：分布式动态规划、分布式MDP中的行动选择、线性和整数规划的拍卖式优化过程以及社会规律。

然后，我们开始考虑竞争和协调问题。虽然多智能体系统领域并不是博弈论的同义词，但毫无疑问，博弈论是该领域内需要掌握的关键工具，因此我们专门用了几章来研究它。第3、5和6章构成了非合作博弈论的速成课程。它们分别涵盖了正常形式、广泛形式和许多其他游戏表示。在这些章节中，就像在其他借鉴博弈论的章节中一样，我们挑选了我们认为需要的材料，以便成为现代博弈论的知识消费者。与传统的博弈论文本不同，我们还包括对算法考虑的讨论。在规范形式表示的背景下，该材料的实质性足以保证其自己的章节，即第4章。

然后，我们切换到多智能体系统中的两个专门主题。在第7章中，我们将介绍多智能体学习。这个话题之所以有趣，有几个原因。首先，它是多智能体系统的一个关键方面。第二，该领域所解决的问题是多种多样的，有时人们还不了解。最后，所使用的技术同样借鉴了计算机科学和博弈论（以及其他一些学科），并不是单智能体情况下学习的直接扩展。

在第8章中，我们介绍了多智能体系统特有的另一个元素，通信。我们涵盖了博弈论环境中的交流，以及语言学家和哲学家传统上认为的合作环境中的沟通（除了我们看到也有博弈论的视角可以渗透进来）。接下来是一个三章的序列，可能被称为“组的协议”

第9章介绍了社会选择理论，包括投票方法。这是一个非策略理论，因为它假设代理人的偏好是已知的，唯一的问题是如何正确地聚合它们。第10章介绍了机制设计，它着眼于即使代理是战略性的，中央设计者如何聚合这些偏好。最后，第11章研究拍卖的特殊情况。

第12章介绍了联盟博弈论，近年来在博弈论中有些被忽视，在计算机科学中肯定没有得到充分重视。

第1章至第12章中的材料主要是贝叶斯和/或算法性质的。因此，其中使用的工具包括概率论、效用论、算法、马尔可夫决策问题和线性/整数规划。最后，我们分两章论述多智能体系统中的逻辑理论。在第13章中，我们将讨论知识和信仰的模态逻辑。这些材料来自哲学和计算机科学，但事实证明，它与第6章中对贝叶斯博弈的讨论非常吻合。最后，在第14章中，我们将讨论扩展到几个方向——我们讨论信念如何随着时间的推移而变化，关于游戏的逻辑模型，以及除了信息态度（知识、信念）之外，人们如何开始使用逻辑来建模动机态度（如“意图”）

2.3 所需背景

这本书严谨，需要数学思维，但只有基本的背景知识。在这本书的大部分内容中，我们假设了基本计算机科学（算法、复杂性）和基本概率论的知识。在更多的技术部分，我们假设熟悉马尔可夫决策问题（MDP）、数学规划（特别是线性和整数规划）和经典逻辑。所有这些（基础计算机科学除外）都在附录中简要介绍，但这些都是为了复习和建立符号，而不是代替这些科目的背景。（概率论尤其如此。）然而，最重要的是，先决条件是清晰思考的能力。

如何从该书中教学？
13章之间存在部分依赖关系。为了理解它们，把这本书想象成由以下“块”组成是很有用的。

块1：第1章至第2章：分布式问题解决

块2：第3-6章：非合作博弈论

3块：第7章：学习

块4，第8章：沟通

块5，第9-11章：团体协议

块6，第12章：合作博弈论

块7，第13-14章：逻辑理论

在每个块中都存在顺序依赖性（在块1中除外，其中各部分在很大程度上彼此独立）。然而，在这些块中，只有一个强烈的依赖性：块3、4和5每个都依赖于非合作博弈论的一些元素，因此也依赖于块2（尽管没有一个块需要整个块）。否则，块之间会有一些有趣的局部成对连接，但没有一个需要覆盖两个块，无论是顺序连接还是并行连接。

鉴于各章节之间的依赖性较弱，根据学生的背景、兴趣和可用时间，有很多方法可以根据材料来制作课程。这本书的网站：
http://www.masfoundations.org/
包含我们和其他同事使用的几个特定教学大纲，以及为学生和教师提供的额外资源。