迷宫-蓝桥杯真题-python解法

题目描述

解题思路

题目的意思就是跟着脚下字母走,如果能从边界走出去就是出了迷宫,如果在里面死循环就是走不出

1.走出迷宫终止条件

当前坐标根据脚下字母移动后X或Y大于10,或者是X或Y小于0。这时候能走出迷宫

2.走不出迷宫的终止条件

如果上一步是和这一步要走的方向是相反的则陷入死循环,走不出迷宫。例如上一步是D当前这一步是U

代码

time#在遍历中记录有多少人走出迷宫

move#移动之后当前脚下字母

lastmove#上一步脚下的字母

move_x#移动之后当前的x坐标

move_y#移动之后当前的y坐标

    a=[list(map(str,input())) for _ in range(10)]
    time=0
    for x in range(10):
        for y in range(10):
            if a[x][y]=='U':
                if x-1<0:
                    time+=1
                    continue
                move=a[x-1][y]
                move_x=x-1
                move_y=y
            if a[x][y] == 'D':
                if x+1>9:
                    time+=1
                    continue
                move = a[x+1][y]
                move_x=x+1
                move_y=y
            if a[x][y]=='R':
                if y+1>9:
                    time+=1
                    continue
                move=a[x][y+1]
                move_x=x
                move_y=y+1
            if a[x][y]=='L':
                if y-1<0:
                    time+=1
                    continue
                move=a[x][y-1]
                move_x=x
                move_y=y-1
            lastmove=a[x][y]
            while True:
                if lastmove=='R' and move=='L':
                    break
                if lastmove=='U' and move=='D':
                    break
                if lastmove == 'L' and move == 'R':
                    break
                if lastmove == 'D' and move == 'U':
                    break

                if move == 'U':
                    if move_x - 1 < 0:
                        time += 1
                        break
                    lastmove = move
                    move = a[move_x - 1][move_y]
                    move_x=move_x-1
                    move_y=move_y
                if move == 'D':
                    if move_x + 1 > 9:
                        time += 1
                        break
                    lastmove = move
                    move = a[move_x + 1][move_y]
                    move_x=move_x+1
                    move_y=move_y
                if move == 'R':
                    if move_y + 1 > 9:
                        time += 1
                        break
                    lastmove = move
                    move = a[move_x][move_y + 1]
                    move_x=move_x
                    move_y=move_y+1
                if move == 'L':
                    if move_y- 1 < 0:
                        time += 1
                        break
                    lastmove = move
                    move = a[move_x][move_y - 1]
                    move_x=move_x
                    move_y=move_y-1
            continue
    print(time)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
很抱歉,作为AI语言模型,我不具备编写代码的能力。但是,我可以提供一个伪代码,帮助你理解Actor-Critic算法在走迷宫中的实现。 首先,我们需要定义一个状态空间,动作空间和奖励函数。假设我们的迷宫是一个5x5的网格,每个格子有四个动作(向上、向下、向左、向右),奖励函数如下: - 初始位置为(0, 0),奖励为0 - 走到目标位置(4, 4),奖励为1 - 走到墙壁或超出边界,奖励为-1 接下来,我们定义Actor和Critic的神经网络模型。Actor模型将状态作为输入,输出每个动作的概率;Critic模型将状态作为输入,输出该状态的值函数。 然后,我们训练Actor和Critic模型。我们采用策略梯度方法更新Actor模型,采用TD误差更新Critic模型。具体算法流程如下: 1. 初始化Actor和Critic模型参数 2. 对于每个episode,重置环境状态并获取初始状态s 3. 对于每个时间步t,Actor根据当前状态s选择动作a,并计算该动作的概率π(a|s) 4. 执行动作a,观察新状态s'和奖励r,并计算TD误差δ=r+γ*V(s')-V(s),其中γ为折扣因子 5. 根据策略梯度方法更新Actor模型参数θ:θ=θ+α*δ*log(π(a|s))*∇(log(π(a|s))) 6. 根据TD误差更新Critic模型参数w:w=w+β*δ*∇V(s) 7. 更新状态为s' 8. 如果到达目标位置或超过最大步数,跳转到步骤2 9. 重复执行步骤2-8,直到达到最大训练次数或Actor和Critic模型参数收敛 最后,我们可以使用训练好的Actor模型来决策走迷宫路径。对于每个状态,我们选择概率最大的动作执行,并将执行结果作为下一个状态。重复执行直到到达目标位置或超过最大步数。 以上是一个简单的Actor-Critic走迷宫的伪代码,具体实现细节还需要结合具体的库和框架进行编写。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值