介绍
我想先问一个简单的问题——你能认出下图中的两个人吗?
我肯定你说对了。对于我们这些早期数学发烧友来说,电影《美丽心灵》(A Beautiful Mind)已经深深地印在了我们的记忆中。Russell Crowe在电影中扮演John Nash,一位诺贝尔经济学奖得主(上图左侧)。
现在,你应该还记得那个经典场景:“不要追金发女郎”。在这个场景中,约翰·纳什引用道:
“当团队中的每个人都在做对自己和团队最有利的事情时,最好的结果就会出现。”
许多人认为这是著名的“纳什均衡”的发现。虽然这场景很经典,但也不一定是对的。这个场景实际上描述了“帕累托最优”。但这对我们理解博弈论还是有帮助的。
所以在这篇文章中,我们将鸟瞰博弈论。我们还将讨论博弈论在人工智能领域的应用。我以一种即使是初学者和非技术人员也能跟上的方式来写这篇文章。
目录
- 什么是博弈论?
- 博弈论中的纳什均衡
- 博弈类型
- 人工智能中的博弈论
什么是博弈论?
什么是博弈论?我相信你在某个时候曾经遇到过这个概念,但从来没有真正深入研究过它。相信我,在人工智能领域,这是一个耐人寻味的话题。
我们先来给博弈论下一个正式的定义。
博弈论可以被认为是两个或多个理性的代理人或玩家之间相互作用的模型。
在这里,我必须强调理性这个关键字,因为它是博弈论的基础。但理性究竟意味着什么呢?
我们可以简单地把理性称为一种理解,即每个行为人都知道所有其他行为人都和他/她一样理性,拥有相同的理解和知识水平。同时,理性指的是,考虑到其他行为人的行为,行为人总是倾向于更高的报酬/回报。
简而言之,每个行为人都是自私的,都试图使报酬最大化。
既然我们已经知道了理性意味着什么,让我们来看看与博弈论相关的其他一些关键词:
- 游戏:一般来说,游戏是由一组玩家,行动/策略和最终收益组成。例如:拍卖、象棋、政治等。
- 玩家:玩家是参与任何游戏的理性实体。例如:
- 在拍卖会的投标人
- 石头剪刀布的玩家
- 参加选举的政治家等。
- 收益:收益是所有玩家在获得特定结果时所获得的奖励。它可以是正的,也可以是负的。正如我们之前所讨论的,每个代理都是自私的,并且想要最大化他们的收益:
博弈论中的纳什均衡
纳什均衡是人工智能博弈论方法的“基石”。纳什均衡是每个玩家选择的行动满足:
“没有玩家会想要改变他们的行动。从纳什均衡中改变他们的行为意味着他们没有达到最佳状态"
或
“考虑到其他所有代理人都是