A*算法求解N数码问题(AI实验一)

11 篇文章 0 订阅

1.实验题目

A*算法求解N数码问题,要求程序内,输入给定初始状态和目标状态,输出所需步数,过程状态及时间(程序可直接运行,无需再手动输入)。

2.实验目的及要求

  • 熟悉和掌握启发式搜索的定义、估价函数和算法过程
  • 利用A*算法求解N数码难题,理解求解流程和搜索顺序
  • 熟练掌握numpy库的相关函数

3.实验原理

A*算法是一种启发式图搜索算法,其特点在于对估价函数的定义上。对于一般的启发式图搜索,总是选择估价函数f值最小的结点作为扩展结点。因此,f是根据需要找到一条最小代价路径的观点来估算结点的,所以,可考虑每个结点n的估价函数值为两个分量:从起始结点到结点n的实际代价以及从结点n到达目标结点的估价代价。
启发式图搜索的基本特点:如何寻找并设计一个与问题有关的h(n)以及构出f(n)=g(n)+h(n),然后以f(n)的大小来排列待扩展状态的次序,每次选择f(n)的最小值进行扩展。

  • open表:保留所有已生成而未扩展的状态
  • closed表:记录已扩展后的状态
    进入open表的状态是根据估值的大小插入到表中合适的位置,每次从表中优先取出启发估价函数值最小的状态加以扩展。

4.实验内容

  1. 以8数码问题为例实现A*算法的求解程序
    original state:
283
164
75

target state:

123
84
765

估价函数f(n)=g(n)+h(n)
g(n)=d(n) ------结点n在搜索树中的深度
h(n)可选择h1(n) — 结点n中“不在位”的数码个数 或 h2(n)=p(n)–当前状态到终点的曼哈顿距离
2. 在求解8数码问题的A* 算法程序中,设置相同的初始状态和目标状态,针对不同的估价函数,求得问题的解,并比较它们对搜索算法性能的影响,包括扩展结点数、生成结点数等
3. 画出A*算法求解框图

5.实验分析

每移动一次空格,就产生一种状态。使用BFS来搜索,但这里使用优先队列而不是普通的队列,这样就可以利用A*算法的核心——评估函数f(n)=g(n)+h(n),对每一种状态用评估函数进行优先队列的排序(只要你给了评估函数的值,优先队列会自己帮我们排序)。
搜索过程如下:
在这里插入图片描述

6.代码实现

from queue import PriorityQueue
import datetime

class node:
    def __lt__(self,other):
        return self.cost < other.cost
       
    def __init__(self,n,s,p):
        self.num = n#str的数组
        self.step = s#当前已经走了的步数,int
        self.zeroPos = p#0的位置,int
        self.cost = 0
        self.parent = None#父指针
        self.setCost()

    def setCost(self):
        global des
        count = 0
        for i in range(len(des)):
            if self.num[i] != des[i]:
                count += 1
        self.cost = count + self.step

    def setParent(self,father):
        self.parent = father

def swap(li,first,second):
    temp = li[first]
    li[first] = li[second]
    li[second] = temp

def format_p(s,N):
    for i in range(N):
        print('\t'.join(s[i*N:(i+1)*N]))
    print()
    
def makeChangeId(N):
    #根据N实现changeId
    li = []
    MAX = N**2
    for i in range(MAX):
        temp = []
        row = i//N#行
        col = i%N#列
        if row is not 0:#上,如果行为0,那么肯定不往上移动了
            temp.append(i-N)
        else:
            temp.append(-1)
        if col is not 0:#左
            temp.append(i-1)
        else:
            temp.append(-1)
        if row is not N-1:#下
            temp.append(i+N)
        else:
            temp.append(-1)        
        if col is not N-1:#右
            temp.append(i+1)
        else:
            temp.append(-1)
        li.append(temp)
    return li

def bfs(start,zeroPos):
    #start is str's list
    #zeroPos is int
    global changeId,visit,que,des,N
    #该函数返回最后一个状态即最后一个node
    startNode = node(start,0,zeroPos)
    que.put(startNode)
    while(not que.empty()):
        outNode = que.get()
        strList = outNode.num#这里是list
        strTuple = tuple(strList)#状态表示,这里是tuple
        if strTuple in visit:
            continue
        visit[strTuple] = 1
        pos = outNode.zeroPos#零的位置
        for i in range(4):
            if changeId[pos][i] != -1:
                swap(strList,pos,changeId[pos][i])               
                joinTuple = tuple(strList)
                if strList == des:
                    print('bingo')
                    swap(strList,pos,changeId[pos][i])
                    #找到了先交换回去,因为这里strList是状态对象的成员了,直接返回的话,就不会执行
                    #下面那句swap了,所以这里得加上一句swap
                    return outNode
                if joinTuple not in visit:
                    new = node(strList.copy(),outNode.step+1,changeId[pos][i])
                    #注意这里必须使用copy,因为不复制传进去的就只是个引用,会导致所有node的成员都是同一个list
                    new.setParent(outNode)
                    que.put(new)
                swap(strList,pos,changeId[pos][i])
                

visit = dict()
que = PriorityQueue()
print('Please input N:')
N = eval(input())
print('Please input the original state:')
src = input().split()#和之前不同,这里存的都是str的list
print('Please input the target state:')
des = input().split()
for i in range(len(src)):
    if src[i] == '0':
        break
start_t = datetime.datetime.now()
changeId = makeChangeId(N)
last = bfs(src,i)

result = [des]#先装des,用作栈使用

def findroot(last,result):
    result.append(last.num)
    if last.parent == None:
        return
    else:
        findroot(last.parent,result)
        
findroot(last,result)

end_t = datetime.datetime.now()
print('The transition from original state to the target state:')
while(len(result)):
    format_p(result.pop(),N)
print('Step number:'+str(last.step+1)+'steps')
print("time = ", (end_t - start_t).total_seconds(), "s")
print('end')

A*算法求解数码问题 1、A*算法基本思想: 1)建立一个队列,计算初始结点的估价函数f,并将初始结点入队,设置队列头和尾指针。 2)取出队列头(队列头指针所指)的结点,如果该结点是目标结点,则输出路径,程序结束。否则对结点进行扩展。 3)检查扩展出的新结点是否与队列中的结点重复,若与不能再扩展的结点重复(位于队列头指针之前),则将它抛弃;若新结点与待扩展的结点重复(位于队列头指针之后),则比较两个结点的估价函数中g的大小,保留较小g值的结点。跳至第五步。 4)如果扩展出的新结点与队列中的结点不重复,则按照它的估价函数f大小将它插入队列中的头结点后待扩展结点的适当位置,使它们按从小到大的顺序排列,最后更新队列尾指针。 5)如果队列头的结点还可以扩展,直接返回第二步。否则将队列头指针指向下一结点,再返回第二步。 2、程序运行基本环境: 源程序所使用编程语言:C# 编译环境:VS2010,.net framework 4.0 运行环境:.net framework 4.0 3、程序运行界面 可使用程序中的test来随机生成源状态与目标状态 此停顿过程中按Enter即可使程序开始运行W(n)部分; 此停顿部分按Enter后程序退出; 4、无解问题运行情况 这里源程序中是先计算源状态与目标状态的逆序对的奇偶性是否一致来判断是否有解的。下面是无解时的运行画面: 输入无解的一组源状态到目标状态,例如: 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 8 7 0 运行画面如下: 5、性能比较 对于任一给定可解初始状态,状态空间有9!/2=181440个状态;当采用不在位棋子数作为启发函数时,深度超过20时,算法求解速度较慢; 其中启发函数P(n)与W(n)的含义如下: P(n): 任意节点与目标结点之间的距离; W(n): 不在位的将牌数; 源状态 目标状态 P(n) 生成节点数 W(n) 生成节点数 P(n) 扩展节点数 W(n) 扩展节点数 2 8 3 1 6 4 7 0 5 1 2 3 8 0 4 7 6 5 11 13 5 6 1 2 3 8 0 4 7 6 5 0 1 3 8 2 4 7 6 5 6 6 2 2 4 8 2 5 1 6 7 0 3 7 4 2 8 5 6 1 3 0 41 79 22 46 6 2 5 8 7 0 3 1 4 0 3 6 7 1 8 4 5 2 359 10530 220 6769 7 6 3 1 0 4 8 5 2 2 8 7 1 3 4 6 5 0 486 8138 312 5295 下图是解决随机生成的100中状态中,P(n)生成函数的生成节点与扩展节点统计图: 由上图可知,P(n)作为启发函数,平均生成节点数大约在1000左右,平均扩展节点数大约在600左右; 下图是解决随机生成的100中状态中,W(n)生成函数的生成节点与扩展节点统计图: 由上图可知,W (n)作为启发函数,平均生成节点数大约在15000左右,是P(n)作为启发函数时的平均生成节点的15倍;W (n)作为启发函数,平均扩展节点数大约在10000左右,是P(n)作为启发函数时的平均扩展节点的15倍; 下图是解决随机生成的100中状态中,两个生成函数的生成节点与扩展节点统计图: 由上述图表可以看到,将P(n)作为启发函数比将W(n)作为启发函数时,生成节点数与扩展节点数更稳定,相比较来说,采用P(n)作为启发函数的性能比采用W(n)作为启发函数的性能好。 6、源代码说明 1)AStar-EightDigital-Statistics文件夹:用来随机生成100个状态,并对这100个状态分别用P(n)与W(n)分别作为启发函数算出生成节点以及扩展节点,以供生成图表使用;运行界面如下: 2)Test文件夹:将0-8这9个数字随机排序,用来随机生成源状态以及目标状态的;运行界面如下: 3)AStar-EightDigital文件夹:输入源状态和目标状态,程序搜索出P(n)与W(n)分别作为启发函数时的生成节点数以及扩展节点数,并给出从源状态到目标状态的移动步骤;运行界面如下: 提高了运行速度的几处编码思想: 1、 在维护open以及close列表的同时,也维护一个类型为hashtable的open以及close列表,主要用来提高判断当前节点是否在open列表以及close列表中出现时的性能; 2、 对于每个状态,按照从左到右,从上到下,依次将数字拼接起来,形成一个唯一标识identify,通过该标识,可以直接判断两个状态是否是同一个状态,而不需要循环判断每个位置上的数字是否相等 3、 在生成每个状态的唯一标识identify时,同时计算了该状态的空格所在位置,通过空格所在位置,可以直接判断能否进行上移、下移、左移、右移等动作; 4、 只计算初始节点的h值,其它生成的节点的h值是根据当前状态的h值、移动的操作等计算后得出的,规则如下: a) 采用W(n)这种方式,不在位置的将牌数,共有以下3中情况: i. 该数字原不在最终位置上,移动后,在其最终位置上 这种情况下,生成的子节点的h值= 父节点的h值-1 ii. 该数字原在最终位置上,移动后,不在其最终位置上 这种情况下,生成的子节点的h值= 父节点的h值 +1 iii. 该数字原不在最终位置上,移动后,还是不在其最终位置上 这种情况下,生成的子节点的h值= 父节点的h值 iv. 该数字原在最终位置上,移动后,还在其最终位置 这种情况不存在 b) 采用P(n)这种方式,节点与目标距离,可通过下面3步完成 i. 首先计算在原位置时,与目标位置的距离,命名为Distance1 ii. 移动后,计算当前位置与目标位置的距离,命名为Distance2 iii. 计算子节点的h值: 子节点的h值 = 父节点的h值- Distance1+ Distance2 5、 在任意状态中的每个数字和目标状态中同一数字的相对距离就有9*9种,可以先将这些相对距离算出来,用一个矩阵存储,这样只要知道两个状态中同一个数字的位置,就可查出它们的相对距离,也就是该数字的偏移距离;例如在一个状态中,数字8的位置是3,在另一状态中位置是7,那么从矩阵的3行7列可找到2,它就是8在两个状态中的偏移距离。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

清风er

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值