人工智能实验四：A*搜索求解8数码问题（启发式搜索算法）

最新推荐文章于 2025-04-01 09:19:17 发布

落灬枫

最新推荐文章于 2025-04-01 09:19:17 发布

阅读量8k

点赞数 29

分类专栏：人工智能实验文章标签：人工智能算法

本文链接：https://blog.csdn.net/weixin_51080803/article/details/136627732

版权

人工智能实验专栏收录该内容

4 篇文章

订阅专栏

本文介绍了如何使用A*搜索算法解决八数码问题，包括评估函数、启发式函数的设计，以及如何通过状态转换实现空格的移动。编程任务要求补全salvePuzzle、calcDistH和moveMap函数，以求解并返回最优移动路径。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.任务描述

本关任务：八数码问题是在一个3×3的棋盘上有1−8位数字随机分布，以及一个空格，与空格相连的棋子可以滑动到空格中，问题的解是通过空格滑动，使得棋盘转化为目标状态，如下图所示。
在这里插入图片描述
为了简化问题的输入，首先将空格用数字0表示，然后将3×3的棋盘用9位长的字符串表示，则上图的初始状态为724506831，目标状态为012345678，本关卡所有目标状态均为012345678，也保证初始状态到目标状态有解。

对于上图的初始状态，将数字2移动到空格，称之为u操作（空格上移），将数字3移动到空格，称之为d操作（空格下移），将数字5移动到空格，称之为l操作（空格左移），将数字6移动到空格，称之为r操作（空格右移），则一个合法移动路径为lurdrdllurrdllurrulldrrull。
724 724 024 204 254 … 012
506 056 756 756 706 … 345
831 831 831 831 831 … 678
l u r d … l

2.相关知识

为了完成本关任务，你需要掌握：1.评估函数，2.贪婪最佳优先搜索，3.A*搜索：缩小总评估代价，4.求解思路。

评估函数
在有信息搜索 Informed Search 策略中，常使用的是最佳优先搜索 Best First Search ，它的结点扩展是基于评估函数值f(n)选择的。评估函数被看做是代价估计，因此代价最低的结点最先被选择扩展。
对f(n)的选择决定了搜索策略，大部分的最佳优先搜索算法的f(n)由启发式函数h(n)构成：
h(n)=结点n到目标的最小代价路径的代价估计值
贪婪最佳优先搜索
贪婪最佳优先搜索 Greedy Best-First Search 试图扩展距离目标结点最近的结点，原因是这种策略可能可以非常快的找到解，因此，贪婪最佳优先搜索只使用启发式信息，即f(n)=h(n)。

A*搜索：缩小总评估代价
A* 搜索（A 星搜索）是最广为人知的最佳优先搜索，它对结点n的代价评估结合了g(n)，即到达此结点n已经花费的路径代价，和h(n)，即从该结点n到目标结点所花代价。
f(n)=g(n)+h(n)
由于g(n)是从开始结点到结点n的路径代价，而h(n)是从结点n到目标结点的最小路径代价的估计值因此：
f(n)=经过结点n的最小代价解的估计代价
所以，要寻找最小代价的解，首先扩展的是g(n)+h(n)值最小的结点。可以发现，A* 搜索算法与一致代价搜索算法类似，区别是 A* 搜索算法使用g(n)+h(n)而不是g(n)。

求解思路
该问题是将与空格相连的数字移动到空格的位置上，也就相当于将空格移动到与之相连的位置，因此，以空格为当前结点，扩展结点可能为上下左右四个相连的位置，若使用一般的搜索算法，可能陷入无限搜索中，永远搜不到目标解，而 A* 搜索算法则能非常好的将搜索过程导向求解目标。

A* 算法的重中之重就是启发式函数h(n)的设计，不同的设计方法可能产生不同的求解路径。在这里，可以选择欧氏距离作为评估函数值：除0之外，各个数字在当前状态的下标与目标状态的下标的绝对值之和。例如：当前状态为123456780，目标状态为：012345678，数字1的下标分别为0和1，数字2的下标分别为1和2，…，数字8的下标分别为7和8，则当前状态与目标状态的评估值为h(n)=abs(1−2)+abs(2−3)+⋯+abs(7−8)=8。

编程要求

本关的编程任务是补全右侧代码片段 salvePuzzle 、 calcDistH 和 moveMap 中 Begin 至 End 中间的代码，具体要求如下：

在 salvePuzzle 中，根据输入参数init（初始状态，如724506831）和targ（目标状态，均为012345678），实现 A* 搜索算法，返回八数码问题的移动路径，如上图的移动路径：lurdrdllurrdllurrulldrrull。

在 calcDistH 中，计算当前状态（参数srcmap，如724506831）到目标状态（参数destmap，如012345678）的启发式函数值h(n)，并返回h(n)。

在 moveMap 中，实现行动转换，并返回下一个状态，例如当前状态为参数curmap=724506831，当前 8 数码状态curmap中空格 0 的位置索引i=4，移动空格到位置j=3，则返回的新状态为newmap=724056831。

测试说明

平台将自动编译补全后的代码，并生成若干组测试数据，接着测试程序会调用上述函数，并判断函数返回的路径是否为合法解，若是则输出 Accepted 表示程序正确，否则程序错误。
以下是平台的测试样例：
测试输入：
724506831
预期输出：
Accepted

实验代码

# -*- coding:utf-8 -*-

class Solution:

    def salvePuzzle(self, init, targ):
        ''' 求解8数码问题
        参数：
        init - 初始状态 例如'123046758'
        targ - 目标状态 均为'012345678'
        返回值：
        clf - 由udlr组成的移动路径字符串
        '''

        #请在这里补充代码，完成本关任务
        #********** Begin **********#
        clf = ''
        state_open = []
        state_close = []
        state_open.append([init,99,'test',init,0])

        fn = 2
        flag = 1
        while True:  
            cur_state = state_open.pop(0)
            state_close.append(cur_state)
            if cur_state[0] == targ :
                while 1:
                    clf += cur_state[2]
                    if cur_state[3] == init:
                        break
                    for id,item in enumerate(state_close[1:]):
                        if item[0] == cur_state[3]:
                            cur_state = item
                return  clf[::-1]

            i = cur_state[0].find('0')
            flag = 1

            if str(i) not in '036':
                tmp_map = self.moveMap(cur_state[0],i,i-1)
                if tmp_map not in [tmp[0] for tmp in state_close]:
                    for id,item in enumerate(state_open):
                        if item[0] == tmp_map:
                            if item[1] + item[4] > self.calcDistH(tmp_map,targ) + cur_state[4] + fn:
                                state_open[id] = [tmp_map,self.calcDistH(tmp_map,targ),'l',cur_state[0],cur_state[4]+fn]
                                flag = 0
                                break
                            break
                    if flag == 1:  
                        state_open.append([tmp_map,self.calcDistH(tmp_map,targ),'l',cur_state[0],cur_state[4]+fn])
            flag = 1 

            if str(i) not in '258':
                tmp_map = self.moveMap(cur_state[0],i,i+1)
                if tmp_map not in [tmp[0] for tmp in state_close]:
                    for id,item in enumerate(state_open):
                        if item[0] == tmp_map:
                            if item[1] + item[4] > self.calcDistH(tmp_map,targ) + cur_state[4] + fn:
                                state_open[id] = [tmp_map,self.calcDistH(tmp_map,targ),'r',cur_state[0],cur_state[4]+fn]
                                flag = 0
                                break
                    if flag ==1:  
                        state_open.append([tmp_map,self.calcDistH(tmp_map,targ),'r',cur_state[0],cur_state[4]+fn]) 
            flag = 1 

            if i-3>=0:
                tmp_map = self.moveMap(cur_state[0],i,i-3)
                if tmp_map not in [tmp[0] for tmp in state_close]:
                    for id,item in enumerate(state_open):
                        if item[0] == tmp_map:
                            if item[1] + item[4] > self.calcDistH(tmp_map,targ) + cur_state[4] + fn:
                                state_open[id] = [tmp_map,self.calcDistH(tmp_map,targ),'u',cur_state[0],cur_state[4]+fn]
                                flag = 0
                                break
                    if flag ==1:  
                        state_open.append([tmp_map,self.calcDistH(tmp_map,targ),'u',cur_state[0],cur_state[4]+fn]) 
            flag = 1 


            if i+3<=8:
                tmp_map = self.moveMap(cur_state[0],i,i+3)
                if tmp_map not in [tmp[0] for tmp in state_close]:
                    for id,item in enumerate(state_open):
                        if item[0] == tmp_map:
                            if item[1] + item[4] > self.calcDistH(tmp_map,targ) + cur_state[4] + fn:
                                state_open[id] = [tmp_map,self.calcDistH(tmp_map,targ),'d',cur_state[0],cur_state[4]+fn]
                                flag = 0
                                break
                    if flag ==1:  
                        state_open.append([tmp_map,self.calcDistH(tmp_map,targ),'d',cur_state[0],cur_state[4]+fn]) 

            state_open.sort(key=lambda x : x[1] + x[4])
        #********** End **********#


    def calcDistH(self, src_map, dest_map):
        '''启发式函数h(n)
        参数：
        src_map  - 当前8数码状态
        dest_map - 目标8数码状态
        返回值：
        clf - 当前状态到目标状态的启发式函数值
        '''

        #请在这里补充代码，完成本关任务
        #********** Begin **********#
        if src_map is None or dest_map is None:
            return 0 

        clf = 0
        for i in range(9):
            clf += abs(int(src_map[i])-int(dest_map[i]))
        return clf
        #********** End **********#

    def moveMap(self, cur_map, i, j):
        '''状态转换（交换位置i和j）
        参数：
        cur_map - 当前8数码状态
        i - 当前8数码状态中空格0的位置索引
        j - 将空格0的位置i移动到位置j，位置j移动到位置i
        返回值：
        clf - 新的8数码状态
        '''

        #请在这里补充代码，完成本关任务
        #********** Begin **********#
        if i>j:
            i,j=j,i
        tmp_i = cur_map[i]
        tmp_j = cur_map[j]
        tmp_map = cur_map[:i]+tmp_j+cur_map[i+1:j]+tmp_i+cur_map[j+1:]

        return tmp_map
        #********** End **********#