c语言 a*算法八数码 详解,使用A*算法解决8数码问题(一)

我的人工智能结业设计报告及源码。因本人水平有限,文中不可避免的存在错误及不妥的地方,欢迎各路高手批评指正。 1

问题描述

8数码问题又称9宫问题,源于一个古老的智力游戏。说白了就是我们小时候玩的“华容道”。意在给定的9格棋盘的8个格子内分别放一个符号,符号之间互不相同,剩下一格做为“出口”。我们把8个符号在棋盘上的排列顺序称作8数码的状态,游戏要求给定一个初始的状态与一个终止状态,符号要经过若干次移动后由初态变成终态,这个过程中只有“出口”附近的符号可以朝“出口”的方向移动,且每次只能移动一个符号。如下图所示,(其中我们用0表示出口,=》表示移动一次,=》*表示移动0-n次):

初态 终态1 2 3 1 2 3 0 1 24 5 6 =》

4 5 6 =》* 3 4 57 8 0 7 0 8 6 7 8

2

解决方案

通过观察我们可以发现每一次8数码的状态都可以通过移动字符变成有限的几种其他状态,比如上图中我们可以知道初态“出口”附近有8和6可以移动,那么这个初态可以经过移动得到两个新的状态。我们人在玩这个游戏的时候,总是要做下面几个步骤:

1.看看哪个符号可以移动。

2.判断一下哪个符号的移动最有利于到达终态。

3.选定一个符号并移动它。

4.判断是否到达终态,是则结束,否则就回到第一步。

而现在我们要使用机器来模拟这一过程,其步骤与人类类似,但不同的是,人在执行第二部的时候总是能预先判断未来好几步的局势,从而选出最有利的一步,而机器则不行,它要先得到一个状态才能知道这个状态下一步将会到哪些状态而无法像我们一样一次就看到后面几步的状态。那么基本思想就是让机器穷尽由初态出发到达所有可能状态的路径,并从中找到有终态的路径作为问题的解。

2.1

A*算法

就如我们上面说到的让机器找出所有的可能来得到问题的解,看起来似乎很简单,但问题在于一旦8数问题的解达到一定规模,机器所要穷尽的路径数量将变得极为庞大,无疑会消耗大量的时间和空间。那么如何让机器像人一样在选择移动符号的时候总是能选择最有利的那一个呢?下面就要介绍启发式搜索中的一个算法A*算法来解决这个问题。

算法描述:

1.首先生成一个搜索的图G,这个图开始只有初始状态n0。生成一个叫open的表,把n0添加到这个表里。

2.生成一个空表名为close。

3.如果open为空,则失败退出。

4.选择open上的第一个结点,把它添加到close里并命名为n,且从open中删除。

5.如果n是终态,那么问题得到解退出,否则到第5步。

6.把n结点扩展,生成其后续状态集M,注意M中不能有n的祖先。把M添加到G中,并让他们成为n的后继。

7.把M中不在open与close表里的点添加到open表里。

8.在open表里按启发函数(见2.2节)的大小重排open表。

9.返回3。

2.2

启发函数

启发函数其实是用来给机器提供额外信息的函数,以此来帮助机器选择。所以启发函数的设计一定要基于问题域,在本设计中采用f(n)=h(n) mod

12+g(n),其中h(n)表示n在搜索树中的深度,g(n)表示的是棋盘上所有结点离其正确位置的曼哈顿距离的和。在实际的搜索中若两个结点的f(n)相同则取深度大的那一个作为最优节点。关于mod

12,是因为随着搜索过程不断进行,搜索树的深度不断加深,h(n)的值将会不断增大,这样会影响搜索的效率,这里举个例子说明一下:假如在搜索树第二层有个节点A,它的曼哈顿距离之和g(n)为20,那么这是个很糟糕的情况了哈(在8数码问题里曼哈顿距离和的的最坏情况为24,这个自己推,我就不解释了),那么此时该结点的耗散值为20+2=22,当机器搜索到第22层时,你会发现22层上任意结点的h(n)=22,如果其中有一个结点B的g(n)=1,就是说B结点中那个不在正确位置上的符号只需要在移动一步就可以到达终态了。那么毫无疑问当前机器应该选择的最优结点就是B,可是要知道机器选择下一个扩展结点的依据是启发函数,如果此时启发函数为f(n)=h(n)+g(n)那么会发生什么情况呢,机器会放弃这个原本最优的结点B(此时B的f(n)=23)转而去选择A结点(A的f(n)=22).如此一来就会增加机器搜索出结果的代价。说到这里,有的人可能会想,那去掉h(n)这一层数因子不是更好?因为曼哈顿距离之和相同的情况下,层次越深的结点越好。不错,但是不要忽略了一个问题,从初态到终态之间不仅仅只有一条路径,如果你去掉层数这个因子,那么机器会一路向下从而忽略同一层次上其他路径上的结点,换句话说就是你通过这样的启发函数得到的路径不一定是最优的。那么现在的情况是,要么牺牲时间获得最佳结果,要么牺牲结果的最佳性而获得最快的速度。本设计则是取折中的结果,在保证速度的情况下尽可能的获得最好的结果,这就是mod

12

的原因,我们在12层这个规模里面遍历所有可能成为解路径上的结点,在12层这个规模外,我们忽略层数的影响,以深度为先。

2.3

可达性判断

现在还余下一个问题,那就是,是否所有的8数问题都有解?答案是否定的,以往的算法都以未找到结果且open表为空来断定当前给定的初始与终结状态互不可达。本设计采用通过判断两状态各自逆序数之和的奇偶性是否相同来判断两状态之间是否可达。实现代码如下:

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
A*算法求解八数码问题 1、A*算法基本思想: 1)建立一个队列,计算初始结点的估价函数f,并将初始结点入队,设置队列头和尾指针。 2)取出队列头(队列头指针所指)的结点,如果该结点是目标结点,则输出路径,程序结束。否则对结点进行扩展。 3)检查扩展出的新结点是否与队列中的结点重复,若与不能再扩展的结点重复(位于队列头指针之前),则将它抛弃;若新结点与待扩展的结点重复(位于队列头指针之后),则比较两个结点的估价函数中g的大小,保留较小g值的结点。跳至第五步。 4)如果扩展出的新结点与队列中的结点不重复,则按照它的估价函数f大小将它插入队列中的头结点后待扩展结点的适当位置,使它们按从小到大的顺序排列,最后更新队列尾指针。 5)如果队列头的结点还可以扩展,直接返回第二步。否则将队列头指针指向下一结点,再返回第二步。 2、程序运行基本环境: 源程序所使用编程语言:C# 编译环境:VS2010,.net framework 4.0 运行环境:.net framework 4.0 3、程序运行界面 可使用程序中的test来随机生成源状态与目标状态 此停顿过程中按Enter即可使程序开始运行W(n)部分; 此停顿部分按Enter后程序退出; 4、无解问题运行情况 这里源程序中是先计算源状态与目标状态的逆序对的奇偶性是否一致来判断是否有解的。下面是无解时的运行画面: 输入无解的一组源状态到目标状态,例如: 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 8 7 0 运行画面如下: 5、性能比较 对于任一给定可解初始状态,状态空间有9!/2=181440个状态;当采用不在位棋子数作为启发函数时,深度超过20时,算法求解速度较慢; 其中启发函数P(n)与W(n)的含义如下: P(n): 任意节点与目标结点之间的距离; W(n): 不在位的将牌数; 源状态 目标状态 P(n) 生成节点数 W(n) 生成节点数 P(n) 扩展节点数 W(n) 扩展节点数 2 8 3 1 6 4 7 0 5 1 2 3 8 0 4 7 6 5 11 13 5 6 1 2 3 8 0 4 7 6 5 0 1 3 8 2 4 7 6 5 6 6 2 2 4 8 2 5 1 6 7 0 3 7 4 2 8 5 6 1 3 0 41 79 22 46 6 2 5 8 7 0 3 1 4 0 3 6 7 1 8 4 5 2 359 10530 220 6769 7 6 3 1 0 4 8 5 2 2 8 7 1 3 4 6 5 0 486 8138 312 5295 下图是解决随机生成的100中状态中,P(n)生成函数的生成节点与扩展节点统计图: 由上图可知,P(n)作为启发函数,平均生成节点数大约在1000左右,平均扩展节点数大约在600左右; 下图是解决随机生成的100中状态中,W(n)生成函数的生成节点与扩展节点统计图: 由上图可知,W (n)作为启发函数,平均生成节点数大约在15000左右,是P(n)作为启发函数时的平均生成节点的15倍;W (n)作为启发函数,平均扩展节点数大约在10000左右,是P(n)作为启发函数时的平均扩展节点的15倍; 下图是解决随机生成的100中状态中,两个生成函数的生成节点与扩展节点统计图: 由上述图表可以看到,将P(n)作为启发函数比将W(n)作为启发函数时,生成节点数与扩展节点数更稳定,相比较来说,采用P(n)作为启发函数的性能比采用W(n)作为启发函数的性能好。 6、源代码说明 1)AStar-EightDigital-Statistics文件夹:用来随机生成100个状态,并对这100个状态分别用P(n)与W(n)分别作为启发函数算出生成节点以及扩展节点,以供生成图表使用;运行界面如下: 2)Test文件夹:将0-8这9个数字随机排序,用来随机生成源状态以及目标状态的;运行界面如下: 3)AStar-EightDigital文件夹:输入源状态和目标状态,程序搜索出P(n)与W(n)分别作为启发函数时的生成节点数以及扩展节点数,并给出从源状态到目标状态的移动步骤;运行界面如下: 提高了运行速度的几处编码思想: 1、 在维护open以及close列表的同时,也维护一个类型为hashtable的open以及close列表,主要用来提高判断当前节点是否在open列表以及close列表中出现时的性能; 2、 对于每个状态,按照从左到右,从上到下,依次将数字拼接起来,形成一个唯一标识identify,通过该标识,可以直接判断两个状态是否是同一个状态,而不需要循环判断每个位置上的数字是否相等 3、 在生成每个状态的唯一标识identify时,同时计算了该状态的空格所在位置,通过空格所在位置,可以直接判断能否进行上移、下移、左移、右移等动作; 4、 只计算初始节点的h值,其它生成的节点的h值是根据当前状态的h值、移动的操作等计算后得出的,规则如下: a) 采用W(n)这种方式,不在位置的将牌数,共有以下3中情况: i. 该数字原不在最终位置上,移动后,在其最终位置上 这种情况下,生成的子节点的h值= 父节点的h值-1 ii. 该数字原在最终位置上,移动后,不在其最终位置上 这种情况下,生成的子节点的h值= 父节点的h值 +1 iii. 该数字原不在最终位置上,移动后,还是不在其最终位置上 这种情况下,生成的子节点的h值= 父节点的h值 iv. 该数字原在最终位置上,移动后,还在其最终位置 这种情况不存在 b) 采用P(n)这种方式,节点与目标距离,可通过下面3步完成 i. 首先计算在原位置时,与目标位置的距离,命名为Distance1 ii. 移动后,计算当前位置与目标位置的距离,命名为Distance2 iii. 计算子节点的h值: 子节点的h值 = 父节点的h值- Distance1+ Distance2 5、 在任意状态中的每个数字和目标状态中同一数字的相对距离就有9*9种,可以先将这些相对距离算出来,用一个矩阵存储,这样只要知道两个状态中同一个数字的位置,就可查出它们的相对距离,也就是该数字的偏移距离;例如在一个状态中,数字8的位置是3,在另一状态中位置是7,那么从矩阵的3行7列可找到2,它就是8在两个状态中的偏移距离。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值