博弈

  博弈可以理解为有限策略选择的竞争性活动,比如下棋、打牌、竞争、战争等。根据参与者种类和策略选择的方式可以将博弈分为很多种,本章讨论的是棋类游戏有关简单的“二人零和、全信息、非偶然”博弈,也就是我们常说的零和博弈(Zero-sum Game)。 所谓“零和”,就是有赢必有输,不存在双赢的结果。所谓“全信息”,也指参与博弈的双方进行决策是能够了解的信息是公开和透明的,不存在信息不对称的情况。比如棋类游戏的棋盘和棋子状态是公开的,下棋的双方都可以看到当前所以棋子的位置,但是很多棋类游戏则不满足全信息的条件,因为棋类游戏都不公开自己手中的牌,也看不到对手手中的牌。所谓的“非偶然”,是指参与博弈的双方的决策都是“理智”的行为,不存在失误和碰运气的情况。

  在博弈过程中,任何一方都希望自己取得胜利,当某一方当前有多个行动方案可供选择时,他总是挑选对自己最为有利同时对对方最为不利的按个行动方案。当然,博弈的另一方也会从多个行动方案中选择一个对自己最为有利的方案进行对抗。参与博弈的双方在对抗或博弈的过程中会遇到各种状态和移动(也可能是棋子落子)的选择,博弈双方交替选择,每一次选择都会产生一个新的棋局状态。假如两个棋手Max和Min 正在一个棋盘上进行博弈。 当Max 做选择时,主动权在Max 上,Max 可以从多个可选决策方案中任选一个行动,一旦Max选定某个行动,主动权就转移到了Min手中。 Min 也会有若干个可选决策方案, Min可能会选择任何一个方案行动,因此Max 必须对做好应对Min 的每一种选择。如果把棋盘抽象为状态,则Max每选择一个决策方案就会触发一个新状态,Min也同样,最终这些状态就会形成一个状态树,这个附加了Max 和 Min的决策过程信息的状态树就是博弈树(Game Tree)。博弈树的根就是搜索开始时的棋盘状态,每个子节点就是Max的每一种决策方案可能产生的棋盘状态(局面),而这些子节点的子节点则是Min的每一种决策方案可能产生的棋盘状态(各层相互间隔)。这棵树的叶子节点就是最终结局,结果无非三种: Max 胜利、Min胜利或者平局。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值