A星算法简单机器人积木动作序列问题

本文介绍了一种使用A*算法解决积木机器人动作序列的问题。A*算法通过评价函数优化搜索路径,避免了BFS和DFS的效率问题。文中详细解释了算法的核心思想,并提供了代码实现,包括openlist和closelist的数据结构,以及如何用二维数组表示积木状态。此外,还给出了测试样例以验证算法的有效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

来自人工智能的实验题实现(block,简单积木机器人问题,给出若干积木状态以及目标状态,为机器人给出动作序列)
(关于A星算法网上有一个经典的寻路例子的中文翻译,有兴趣可以先原英文翻译中文翻译


现有积木若干,积木可以放在桌子上,也可以放在另一块积木上面。

状态表示如下:

clear(x):积木x上面没有任何积木。
onx,y):积木x在积木y上面。
ontable(x):积木x在桌子上。
操作表示如下:

move(x,y):把积木x放到积木y上面。前提是积木x和积木y上面都没有其他积木。
moveToTable(x):把积木x放到桌子上,前提是积木x上面无其他积木,且积木x不在桌子上(即x在其他积木上面)。
举例如下:

初始状态序列:cleara), ona,b), onb,c), ontablec), cleard), ontabled),
目标状态序列:cleara), ona,c), ontablec), clearb), ond,b), ontableb),
操作方案序列:moveToTable(a), moveToTable(b), move(a,c), move(d,b)。
请使用A*算法来规划此问题。INPUT为初始状态序列和目标状态序列,OUTPUT为操作方案序列。

对于A星算法,其实就是比我们一般的BFS,DFS通过评价函数来约束,使得我们的搜索更快的接近最优解
其核心思想就是通过定义评价函数f=g+h(其中g其实可以当作是到达当前状态已经走过的步数或者说是消耗代价,h则是我们定义的一个由当前状态到达目标状态的估值函数,一般该值小于真实值,所以f其实就是整个过程的估值)

其次就是我们要维护的两个表:openlist和closelist
openlist其实就是我们从开始状态搜索后续状态是衍生的后继状态加入到其中,然后每次从中取出评价函数值最小的状态进行后续搜索,我比较倾向于用存有状态的优先队列来作为我们的openlist,因为我们可以定义优先队列按评价函数值大小来排序,这样一来每次取得的状态点其实就是评价函数值最小的点。至于closelist为了后面查重需要所以可以用vector或者list


直接附上我的代码,一口气写下来的,没有考虑空间时间的问题,考虑空间问题其实可以用一维数组存的。
比如clear(a),on(a,d),on(d,b),ontable(b),ontable(c)就可以用
[ 3,-1,-1,1]
[a][b][c][d]
按a,b,c,d索引为0,1,2,3来设计,a下面是d,指向d的索引3,b下面没有,指向-1,c下面也没有,指向-1,d下面是b,指向b的索引1

我这里就用二维数组存,a下面有d,则mat[0][3]=1;d下面有b,则mat[3][1]=1;b在桌面上,则mat[1][1]=1;c在桌面上,则mat[2][2]=1;其他为0
所以如果一个木块a不在桌面上并且其上是clear的,则mat[0~n][0]=0


#include <iostream>
#include <cmath>
#include <string>
#include <queue>
#include <list> 
#include <cstring>
using namespace std;
const int num =20; //预定义下规模 
int mat_begin[num][num]; //初始状态矩阵 
int mat_end[num][num];  //目标状态矩阵 
int index1,index2; //状态的语句数,如on(a,b),ontable(b),ontable(c) 为3个  
int row = -1;//可能积木个数没有num那么多,可以对矩阵操作时候节省时间 ,row=col 

struct operator_string
{
    string str_operator; //moveToTable 或者 move 
    string str_A; //第一个操作对象 
    string str_B; //第二个操作对象 
};

struct status
{
    int g; //==搜索了第几步 
    int h;//估值,与目标的估计距离 
    int mat[num][num];//每一个状态下的矩阵 
    list<operator_string> array_operator;//用来存储操作序列 
    //可移动的对象 
    string not_ontable; //不在桌面上并且上面没有其他积木的木块 
    string ontable; //在桌面上的木块并且上面没有其他积木的木块 
    string sum;
    friend bool operator< (status n1, status n2){
        return n1.g+n1.h > n2.g+n2.h;   //">"为从小到大排列 f=g+h 
    }   
};

list<status> li;
string deal_space(string s)  //预处理一下客户输入的字符串,因为可能出现多余空格的问题 
{
    string temp = s;
    int size = temp.size();
    for( int i = 0; i < size; i ++ ){
        if( temp[i] ==' '){
            for ( int j = i; j < size; j ++ ) temp[j] = temp[j+1];
            i--;
            size--;
        }
        if( temp[i] == ',' && temp[i-1] == ')'){        //将‘)’后面的逗号处理掉 
            for ( int j = i; j < size; j ++ ) temp[j] = temp[j+1];
            i--;
            size--;
        }
     } 
     return temp;
}

void show_mat(int mat[num][num])//显示矩阵 
{
    for(int i=0;i<row;i++){
        for(int j=0;j<row;j++){
            cout<<mat[i][j]<<" ";
        }
        cout<<endl;
    }
}

bool same_mat(int a[num][num],int b[num][num])//矩阵是否相同 
{
    int ans = 0;
    for(int i=0;i<row;i++){
        for(int j=0;j<row;j++){
            if(a[i][j]!=b[i][j]){
                ans = 1;
                break;
            }
        }
    }
    if(ans == 0) return true;
    else
    return false;
}

void copy_mat(int a[num][num],int b[num][num])//拷贝矩阵 
{
    for( int i = 0 ; i < num ; i++ )
        for ( int j = 0; j < num; j ++ ) a[i][j]=b[i][j];
}

void string_to_mat(string s,int & index,int & row,int  mat[num][num])//将字符串转为状态矩阵 
{
    int size = s.size();
    int flag1=0,flag2=0;//flag1对应着左括号,flag2对应逗号 
    string temp1="",temp2="",temp3="";  //temp代表on/ontable/clear, temp2代表第一个操作对象,temp3代表第二个对象 
    for( int i = 0; i < size; i++ ){
        if( flag1 == 0 && s[i] != '(' ) temp1 += s[i];
        else if( flag1 == 0 && s[i] == '(' ) flag1 = 1;
        else if( flag2 == 0 && s[i] != ',' && s[i] != ')' ) temp2 += s[i];
        else if( s[i] == ',' ) flag2 = 1;
        else if( flag2 == 1 && s[i] != ')' ) temp3 += s[i];
        else if( s[i] == ')' ){     //一旦遇到有括号,就开始操作 
            flag1 = 0,flag2 = 0;
            if( temp1 == "on" ){
                row = max(row,temp2[0]-'a');
                row = max(row,temp3[0]-'a');//row 就是为了找总共有a、b、c、d、e...多少个 
                mat[ temp2[0] - 'a' ][ temp3[0] - 'a' ] = 1;//设为1 
            }
            else if( temp1 == "ontable" ){
                row = max(row,temp2[0]-'a');
                mat[ temp2[0] -'a' ][ temp2[0] - 'a' ] = 1;//设为1 
            }
            else{
                row = max(row,temp2[0]-'a');//clear,不用操作 
            }
            temp1 = "",temp2 = "",temp3 = "";
            index++;    
        }
        else 
        continue;
    }
    row++;
}

int count_h(int a[num][num],int b[num][num]) //计算h的估值 方法是从底部网上找相同,相同加一 
{
    int visit[num][num];
    memset(visit,0,sizeof(visit));
    int ans  = 0;
    for(int i = 0; i < row; i++ ){
        if(a[i][i]==b[i][i]&&a[i][i]==1&&visit[i][i]==0){
            visit[i][i]=1;
            ans++;
            int k = i;
            int flag=1;
            while(flag){
  //如果flag=0,证明该木块往上已经找不到木块了,终止循环 
                flag=0;
                int temp;
                for(int j=0;j<row;j++){
                    if(a[j][k]==b[j][k]&&a[j][k]==1&&visit[j][k]==0){
  //该列 
                        flag=1;
                        visit[j][k]=1;
                        ans++;
                        temp = j;
                    }
                }
                k=temp;  
            } 
         } 
    }
    return row - ans;
}
void strategy(status & current)//计算可以做的下一步操作,将对象加到not_ontable 和ontable两个字符串中,以便后面取得下一步操作策略 
{
    for( int j = 0 ; j < row ; j ++ ){
        int ans1=0,ans2=0;
        for( int i = 0 ; i < row ; i ++ ){
            if( current.mat[i][j] == 1 ){
                if( i != j) ans2++;
                ans1++;
            }   
        }
        if( ans1 == 0 ) current.not_ontable += ( j + 'a');
        else
            if( ans2 == 0) current.ontable += ( j + 'a');
    }
    current.sum = current.not_ontable + current.ontable;
}

void copy_and_change(status & to,status from,
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值