人工智能——与或图的搜索


与或图的搜索


与或图是一个超图,节点间通过连接符连接

   超图(Hypergraph)是什么

      简单的来说,对于我们熟悉的图而言,它的一个边(edge)只能和两个顶点连接;而对于超图来讲,人们定义它的边(这里叫超边,hyperedge)可以和任意个数的顶点连接。一个图和超图的示意图如下所示:

  而对于超图的一个严格的数学定义,维基百科上是这样写的:

      In mathematics, a hypergraph is a generalization of a graph, where an edge can connect any number of vertices. Formally, a hypergraph H is a pair H = (X,E) where X is a set of elements, called nodes or vertices, and E is a set of non-empty subsets of X called hyperedges or links.

      k-均匀超图(k-uniform hypergraph)

      对于超图而言,还有一个k-均匀超图的概念(k-uniform hypergraph)。它指超图的每个边连接的顶点个数都是相同的,即为个数k。所以2-均匀超图就是我们传统意义上的图,3-均匀超图就是一个三元组的集合,以此类推。

此段摘自: http://blog.csdn.net/raodotcong/article/details/6429991


耗散值的计算:

k(n, N) = Cn+k(n1, N)+…+k(ni, N)          其中:N为终节点集   Cn为连接符的耗散值


能解节点:

终节点是能解节点
若非终节点有“或”子节点时,当且仅当其子节点至少有一能解时,该非终节点才能解。
若非终节点有“与”子节点时,当且仅当其子节点均能解时,该非终节点才能解。


不能解节点:

没有后裔的非终节点是不能解节点。
若非终节点有“或”子节点,当且仅当所有子节点均不能解时,该非终节点才不能解。
若非终节点有“与”子节点时,当至少有一个子节点不能解时,该非终节点才能解。


与或图(树)表示三解梵塔问题


其中(1,1,1)表示CBA三个环都套在第一个杆上,我们的目标是将CBA都移动到第三个杆上,即变为(3,3,3)


与或图的启发式搜索算法(AO*算法):

两个过程:1、图生成过程,即扩展节点         2、计算耗散值的过程


博弈树搜索:

博弈问题特点:

          1、双人对弈,轮流走步

          2、信息完备,双方所得到的信息是一样的

          3、零和,即对一方有利的棋,对另一方肯定是不利的,不存在对双方均有利或无利的棋

博弈的特性:

          1、两个棋手交替地走棋

          2、比赛的最终结果,是赢、输和平局中的一种

          3、可用图搜索技术进行,但效率很低

          4、博弈的过程,是寻找置对手于必败态的过程

          5、双方都无法干预对方的选择

例:

Grundy博弈

Grundy博弈是一个分钱币的游戏。有 一堆数目为N的钱币,由两位选手轮流进行分堆,要求每个选手每次只把其中某一堆分成数目不等的两小堆。例如,选手甲把N分成两堆后,轮到选手乙就可以挑其中一堆来分,如此进行下去,直到有一位选手无法把钱币再分成不相等的两堆时就得认输。



例2:

Grundy博弈是取石子的游戏。有 一堆数目为N(=15)的石子,由两位选手轮流进行选取,要求每个选手每次只能选取1、或2、或3个石子、拾取最后一个石子的为胜者。设计一种获胜策略。

答:1、先选取;
        2、(15)-12-(9、10、11)-8-(5、6、7)-4-(3、2、1)


极小极大搜索过程

中国象棋:

对各个局面进行评估
评估的目的:对后面的状态提前进行考虑,并且以各种状态的评估值为基础作出最好的走棋选择。 
评估的方法:用评价函数对棋局进行评估。赢的评估值设为+∞,输的评估值设为-∞,平局的评估值设为0。 
评估的标准:由于下棋的双方是对立的,只能选择其中一方为评估的标准方。

由于正方和反方是交替走步的,因此MAX节点和MIN节点会交替出现。

正方(MAX节点)从所有子节点中,选取具有最大评估值的节点。
反方(MIN节点)从其所有子节点中,选取具有最小评估值的节点。
反复进行这种选取,就可以得到双方各个节点的评估值。这种确定棋步的方法,称为极小极大搜索法。 


例:

设有一个摆放三个子的棋盘残局,如下图所示,〇和╳在结束前有三步棋可以走,而且设走第一步的是╳ 。这时存在着三个空格A,B,C,用博弈树搜索算法判断应该把棋子放到哪一格内。 



 所以,对于棋盘残局中的╳来说,最好的选择,是将╳放在C的位置上,这时可以导致平局局面。


α-β搜索过程

 出现原因:

在极小极大法中,必须求出所有终端节点的评估值,当预先考虑的棋步比较多时,计算量会大大增加。为了提高搜索的效率,引入了通过对评估值的上下限进行估计,从而减少需进行评估的节点范围的α-β剪支法。


MAX节点的评估下限值α:

作为正方出现的MAX节点,假设它的MIN子节点有N个,那么当它的第一个MIN子节点的评估值为α时,则对于其它的子节点,如果有高过的,就取那最高的值作为该MAX节点的评估值;如果没有,则该MAX节点的评估值为α。

 MIN节点的评估上限值β:

作为反方出现的MIN节点,假设它的MAX子节点有N个,那么当它的第一个MAX子节点的评估值为β时,则对于其它子节点,如果有低于的,就取那个低于的值作为该MIN节点的评估值;如果没有,则该MIN节点的评估值取β

α剪支法:

设MAX节点的下限为α,则其所有的MIN子节点中,其评估值的β上限小于等于α的节点,其以下部分的搜索都可以停止了,即对这部分节点进行了α剪支。

β剪支法:

设MIN节点的上限为β,则其所有的MAX子节点中,其评估值的α下限大于等于β的节点,其以下部分的搜索都可以停止了,即对这部分节点进行了β剪支。


改进:

改进1:

         使用-剪支技术,当不满足剪支条件(即)时或值比值大不了多少或极相近时,这时也可以进行剪支,以便有条件把搜索集中到会带来更大效果的其他路径上,这就是中止对效益不大的一些子树的搜索,以提高搜索效率。

改进2:

         不严格限制搜索的深度。当到达深度限制时,如出现博弈格局有可能发生较大变化时,则应多搜索几层,使格局进入较稳定状态后再中止,这样可使倒推值计算的结果比较合理,避免考虑不充分产生的影响,这是等候状态平稳后中止搜索的方法。

改进3:

         当算法给出所选的走步后,不要马上停止搜索,而是在原先估计可能的路径上再往前搜索几步,再次检验会不会出现意外,这是一种增添辅助搜索的方法。

改进4:

         对某些博弈的开局阶段和残局阶段,往往总结了一些固定的对弈模式,因此可以利用这些知识编好走步表,以便在开局和结局时使用查表法。只是在进入中盘阶段后,再调用其他有效的搜索算法,来选择最优的走步。



  • 7
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
三梵塔问题是一个经典的益智问题,其求解过程可以用与或来表示,具体如下: 1. 构造与或 将三个塔分别标为A、B、C,将移动盘子的过程看作一组操作,可以表示为A->B、A->C、B->A、B->C、C->A、C->B六种不同的移动方式。将这些操作表示为的节点,将它们之间的依赖关系表示为的边,得到的就是三梵塔问题的与或。具体如下所示: ``` +---------+ +---------+ +---------+ | A->B | | B->A | | A->C | +----+----+ +----+----+ +----+----+ | | | v v v +---------+ +---------+ +---------+ | B->C | | C->A | | C->B | +----+----+ +----+----+ +----+----+ | | | v v v +---------+ +---------+ +---------+ | C->B | | A->C | | B->A | +----+----+ +----+----+ +----+----+ | | | v v v +---------+ +---------+ +---------+ | C->A | | B->C | | C->A | +----+----+ +----+----+ +----+----+ | | | v v v +---------+ +---------+ +---------+ | B->A | | C->B | | A->B | +----+----+ +----+----+ +----+----+ | | | v v v +---------+ +---------+ +---------+ | A->C | | A->B | | B->C | +----+----+ +----+----+ +----+----+ ``` 2. 求解问题 在与或中,起点是所有操作都未执行的情况,终点是所有盘子都移到目标塔的情况。为了求解问题,需要从起点开始,按照与或的拓扑结构依次进行操作,直到到达终点。具体过程如下: 1)起点:所有操作都未执行,即A塔上有三个盘子,B和C塔上均没有盘子。 2)第一步:根据与或的拓扑结构,选择其中的一条路径进行操作。比如,选择A->B这条路径,将A塔上最上面的一个盘子移动到B塔上。此时,A塔上剩余两个盘子,B塔上有一个盘子,C塔上仍然没有盘子。 3)第二步:再次根据与或的拓扑结构,选择一条路径进行操作。比如,选择A->C这条路径,将A塔上下面的一个盘子移动到C塔上。此时,A塔上只剩下一个盘子,B塔上有一个盘子,C塔上有一个盘子。 4)第三步:继续选择路径进行操作,直到所有盘子都移到目标塔上。 通过以上步骤,即可求解三梵塔问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值