采用状态空间法求解八数码问题

一、 实验要求

八数码问题:在3×3的方格棋盘上,摆放着1到8这八个数码,有1个方格是空的,其初始状态如图1所示,要求对空格执行空格左移、空格右移、空格上移和空格下移这四个操作使得棋盘从初始状态到目标状态。
在这里插入图片描述
请任选一种盲目搜索算法(深度优先搜索或宽度优先搜索)或 任选一种启发式搜索方法(A 算法或 A* 算法)编程求解八数码问题(初始状态任选),并对实验结果进行分析,得出合理的结论。

二、 实验目标

  1. 熟悉人工智能系统中的问题求解过程;
  2. 熟悉状态空间的盲目搜索和启发式搜索算法的应用;
  3. 熟悉对八数码问题的建模、求解及编程语言的应用。

三、 实验过程

1、 算法基本原理和流程框图;
定义结点goal,搜索中每次出现的一个棋盘都相当于一个结点goal,定义一个队列st用于保存搜索中所出现的所有棋盘结点,一个棋盘结点为队列的一个成员。
广度优先搜索的基本思想是:
从初始结点 h 开始, 逐层地对结点进行扩展并考察它是否为目标结点,若不是目标结点, 则放入待考察队列中; 在第 n 层的结点没有全部扩展并考察之前,不对第 n+1 层的结点进行扩展。 队列中的结点总是按进入的先后顺序排列, 先进入的结点排在前面, 后进入的排在后面。其搜索过程如下:
(1) 初始化结点path[1]放入队列中, 队头指针 front=path[1];
(2) 若 front>rear,则问题无解,退出;
(3) 取出队头结点 front,s=front,front指向队列中的下一个结点;
(4) 考察结点s是否为目标结点,若是,则问解求得,退出;
(5) 考察结点 s在上下左右四个方向上是否可扩展,将其可扩展的子结点放入队尾, 然后转步骤 2。

2、 基本数据结构分析和实现;

const int maxn = 362880; ///最多9!个情况
int path[maxn];
typedef int state [9];
state st[maxn],goal;  ///状态数组,所有状态都保存在这个里面
int dist [maxn];
const int dx[]={
   -1,1,0,0};
const int dy[]={
   0,0,-1,1};
int ss;

对于同一个结点判重,将状态转化为9位的十进制数,然后根据stl里面set的唯一元素性质来判断是否到过这一步。

3、 编写程序的各个子模块实现:
(1)状态转换函数:

void init() {
    vis.clear(); }
int try_to_insert(int s)
{
   
	int v=0;
	for(int i=0;i<9;i++) v=v*10+st[s][i];
	if(vis.count(v)) return 0;
	vis.insert(v);
	return 1;
}

(2)输出函数,递归记录步数:

void print()
{
	//printf("21\n");
	int way[100000],temp=0;
 
    while (path[ss]!=ss) {
        way[temp]=ss;
        temp++;
        ss=path[ss];
    }
 
    for (int x=temp-1;x>=0;x--){
        ss=way[x];
        for (int i=0;i<9;i++) {
                if (i%3==0) puts ("");
                printf ("%d ",st[ss][i]);
        }
        puts ("");
    }
}

(3)判断是否有解的函数,按照逆序数的关系求解

bool judge()
{
    int sum1=0;
    int sum2=0;
     for (int i=0;i<9;i++){
        if (st[1][i]==0) continue;
        for (int j=i+1;j<9;j++){
            if (st[1][j]==0) continue;
            if (st[1][i]>st[1][j]) sum1++;
        }
    }
    for (int i=0;i<9;i++){
        if (goal[i]==0) continue;
        for (int j=i+1;j<9;j++){
            if (goal[j]==0) continue;
            if (goal[i]>goal[j]) sum2++;
        }
    }
    if(sum1%2==sum2%2)
        return true;
     return false;
}

(4)广度优先搜索函数,利用二维数组记录下走的状态,通过Set比较,然后记录

int bfs()
{
    init();
    path[1]=1;
    int front=1,rear = 2;  ///不使用下标0,因为0被当做不存在
    while (front < rear){
        state &s = st [front];
        if (memcmp(goal,s,sizeof(s))==0) {   ///比较
                return front;
        }
        int z;
        for (z=0;z<9;z++) if (!s[z]) break;  ///找到0的位置
        //printf ("%d\n",z);
        int x=z/3,y=z%3;
        for (int d=0;d<4;d++){ ///化成3x3的方格,然后移动方向
                //puts("f");
            int newx=x+dx[d];
            int newy=y+dy[d];
            int newz=newx*3+newy; ///退回1一行数列,然后记录
            //printf ("%d %d\n",x,y);
            if (newx>=0&&newx<3&&newy>=0&&newy<3){
                state & t=st[rear];
                memcpy (&t,&s,sizeof (s));  ///复制,拓展一个新的结点
                t[newz] = s[z];
                t[z]=s[newz];
                //dist[rear]=dist[front]+1;
                if (try_to_insert (rear)) {  ///若插入成功,修改队尾指针
                        path[rear]=front;
                        rear++;
                }
            }
        }
        front++;  ///拓展完成后修改队首的指针
    }
    return 0; ///失败
}

4、 程序运行结果,含使用的搜索算法及搜索路径等;
上机试验时,经多次程序调试,最后得一下结果。此结果所得节点(状态图)很多,可知宽度优先搜索的盲目性很大, 当目标节点距离初始节点较远时,就会产生大量的无用节点,搜索效率低。但是,只要问题有解,

  • 12
    点赞
  • 82
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
A*算求解数码问题 1、A*算基本思想: 1)建立一个队列,计算初始结点的估价函数f,并将初始结点入队,设置队列头和尾指针。 2)取出队列头(队列头指针所指)的结点,如果该结点是目标结点,则输出路径,程序结束。否则对结点进行扩展。 3)检查扩展出的新结点是否与队列中的结点重复,若与不能再扩展的结点重复(位于队列头指针之前),则将它抛弃;若新结点与待扩展的结点重复(位于队列头指针之后),则比较两个结点的估价函数中g的大小,保留较小g值的结点。跳至第五步。 4)如果扩展出的新结点与队列中的结点不重复,则按照它的估价函数f大小将它插入队列中的头结点后待扩展结点的适当位置,使它们按从小到大的顺序排列,最后更新队列尾指针。 5)如果队列头的结点还可以扩展,直接返回第二步。否则将队列头指针指向下一结点,再返回第二步。 2、程序运行基本环境: 源程序所使用编程语言:C# 编译环境:VS2010,.net framework 4.0 运行环境:.net framework 4.0 3、程序运行界面 可使用程序中的test来随机生成源状态与目标状态 此停顿过程中按Enter即可使程序开始运行W(n)部分; 此停顿部分按Enter后程序退出; 4、无解问题运行情况 这里源程序中是先计算源状态与目标状态的逆序对的奇偶性是否一致来判断是否有解的。下面是无解时的运行画面: 输入无解的一组源状态到目标状态,例如: 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 8 7 0 运行画面如下: 5、性能比较 对于任一给定可解初始状态状态空间有9!/2=181440个状态;当采用不在位棋子数作为启发函数时,深度超过20时,算求解速度较慢; 其中启发函数P(n)与W(n)的含义如下: P(n): 任意节点与目标结点之间的距离; W(n): 不在位的将牌数; 源状态 目标状态 P(n) 生成节点数 W(n) 生成节点数 P(n) 扩展节点数 W(n) 扩展节点数 2 8 3 1 6 4 7 0 5 1 2 3 8 0 4 7 6 5 11 13 5 6 1 2 3 8 0 4 7 6 5 0 1 3 8 2 4 7 6 5 6 6 2 2 4 8 2 5 1 6 7 0 3 7 4 2 8 5 6 1 3 0 41 79 22 46 6 2 5 8 7 0 3 1 4 0 3 6 7 1 8 4 5 2 359 10530 220 6769 7 6 3 1 0 4 8 5 2 2 8 7 1 3 4 6 5 0 486 8138 312 5295 下图是解决随机生成的100中状态中,P(n)生成函数的生成节点与扩展节点统计图: 由上图可知,P(n)作为启发函数,平均生成节点数大约在1000左右,平均扩展节点数大约在600左右; 下图是解决随机生成的100中状态中,W(n)生成函数的生成节点与扩展节点统计图: 由上图可知,W (n)作为启发函数,平均生成节点数大约在15000左右,是P(n)作为启发函数时的平均生成节点的15倍;W (n)作为启发函数,平均扩展节点数大约在10000左右,是P(n)作为启发函数时的平均扩展节点的15倍; 下图是解决随机生成的100中状态中,两个生成函数的生成节点与扩展节点统计图: 由上述图表可以看到,将P(n)作为启发函数比将W(n)作为启发函数时,生成节点数与扩展节点数更稳定,相比较来说,采用P(n)作为启发函数的性能比采用W(n)作为启发函数的性能好。 6、源代码说明 1)AStar-EightDigital-Statistics文件夹:用来随机生成100个状态,并对这100个状态分别用P(n)与W(n)分别作为启发函数算出生成节点以及扩展节点,以供生成图表使用;运行界面如下: 2)Test文件夹:将0-8这9个数字随机排序,用来随机生成源状态以及目标状态的;运行界面如下: 3)AStar-EightDigital文件夹:输入源状态和目标状态,程序搜索出P(n)与W(n)分别作为启发函数时的生成节点数以及扩展节点数,并给出从源状态到目标状态的移动步骤;运行界面如下: 提高了运行速度的几处编码思想: 1、 在维护open以及close列表的同时,也维护一个类型为hashtable的open以及close列表,主要用来提高判断当前节点是否在open列表以及close列表中出现时的性能; 2、 对于每个状态,按照从左到右,从上到下,依次将数字拼接起来,形成一个唯一标识identify,通过该标识,可以直接判断两个状态是否是同一个状态,而不需要循环判断每个位置上的数字是否相等 3、 在生成每个状态的唯一标识identify时,同时计算了该状态的空格所在位置,通过空格所在位置,可以直接判断能否进行上移、下移、左移、右移等动作; 4、 只计算初始节点的h值,其它生成的节点的h值是根据当前状态的h值、移动的操作等计算后得出的,规则如下: a) 采用W(n)这种方式,不在位置的将牌数,共有以下3中情况: i. 该数字原不在最终位置上,移动后,在其最终位置上 这种情况下,生成的子节点的h值= 父节点的h值-1 ii. 该数字原在最终位置上,移动后,不在其最终位置上 这种情况下,生成的子节点的h值= 父节点的h值 +1 iii. 该数字原不在最终位置上,移动后,还是不在其最终位置上 这种情况下,生成的子节点的h值= 父节点的h值 iv. 该数字原在最终位置上,移动后,还在其最终位置 这种情况不存在 b) 采用P(n)这种方式,节点与目标距离,可通过下面3步完成 i. 首先计算在原位置时,与目标位置的距离,命名为Distance1 ii. 移动后,计算当前位置与目标位置的距离,命名为Distance2 iii. 计算子节点的h值: 子节点的h值 = 父节点的h值- Distance1+ Distance2 5、 在任意状态中的每个数字和目标状态中同一数字的相对距离就有9*9种,可以先将这些相对距离算出来,用一个矩阵存储,这样只要知道两个状态中同一个数字的位置,就可查出它们的相对距离,也就是该数字的偏移距离;例如在一个状态中,数字8的位置是3,在另一状态中位置是7,那么从矩阵的3行7列可找到2,它就是8在两个状态中的偏移距离。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值