AI创想家的迷宫寻宝代码好用的,自己的上分太匮乏了(想加入动态查找在么加)

import api

import operator

def update(context):

    m_col = context.me.col

    m_row = context.me.row

    # 拿到对手的企鹅 row 信息

    enemy_col = api.get.enemy(what="score")

    # 打印出我的企鹅所在的行

    print(enemy_col)

    target=target_choice(context)

    color=target[0]

    path=target[1]

    print(color,path)

    #调用最有价值宝石函数,并获取最有价值路径

    path = Best_Value(context,target)

    m_energy = context.me.energy

    exit_path=api.check.path(start=(m_row,m_col),end=(context.exit.row,context.exit.col))

    exit_distance=len(exit_path)-1

    #print("当前体力:"+str(m_energy)+"目标距离:"+str(exit_distance))

    #计算体力

    if m_energy <= exit_distance+1:

        path=exit_path

    print("****************************正在进行的坐标为********************",path[1][0],path[1][1])

    t_row=path[1][0]

    t_col=path[1][1]

    if t_col - m_col > 0:

        return "R"

    elif t_col - m_col < 0:

        return "L"

    if t_row - m_row > 0:

        return "D"

    elif t_row - m_row < 0:

        return "U"

def target_choice(context):

    m_col = context.me.col

    m_row = context.me.row

    min_distance = 99

    color = ["red_gem", "blue_gem","purple_gem","pink_gem","yellow_gem","box"]

    # 遍历场上所有宝石到企鹅的距离,将target_gem设置为距离更小的宝石名称

    for i in range(0, 6):

        path=api.check.path(start=(m_row,m_col),end=(context.items[color[i]][0].row,context.items[color[i]][0].col))

        distance = len(path)

        if distance < min_distance:

            min_distance = distance

            target_gem = color[i]

            target_path = path

    return target_gem,target_path

#计算最有价值路径(环境变量,目标变量)

def Best_Value(context,target_old):

    BV_color=target_old[0]#存放目标宝石颜色

    BVpath=target_old[1]#存放目标宝石路径

    #获取当前最少宝石的距离

    if(BV_color != "box"):

        #print("查找最有价值路径")

        dict = context.me.item_count

        #dict.pop('box')

        a = sorted(dict.items(), key=operator.itemgetter(1))

        #a1 = sorted(dict.items(), key=operator.itemgetter(0))

        print(a)

        #print(a1)

        if a[0][0]=='box':

            if(a[1][1]<a[2][1] and a[1][0] !=BV_color):

                print("识别到数量最少宝石",a[1][0],"一共有",a[1][1])

                #计算最少宝石的距离

                min_gem = api.check.path(start=(context.me.row,context.me.col),end=(context.items[a[1][0]][0].row,context.items[a[1][0]][0].col))  

                #print("最少宝石的距离为",len(min_gem))

                max_b = 6/len(min_gem)

                max_path=1/len(BVpath)

                print("最少宝石的价值性为",max_b,"目标价值为",max_path)

                if(max_path<max_b and len(BVpath)>5):#最少宝石价值高于目标宝石,且目标宝石在距离超过5步

                    BVpath = min_gem

                    print("!!!——————目标比最少宝石的价值低,寻找最少宝石",BVpath)

        else:

            if(a[0][1]<a[1][1] and a[0][0] !=BV_color):

                print("识别到数量最少宝石",a[0][0],"一共有",a[0][1])

                #计算最少宝石的距离

                min_gem = api.check.path(start=(context.me.row,context.me.col),end=(context.items[a[0][0]][0].row,context.items[a[0][0]][0].col))  

                #print("最少宝石的距离为",len(min_gem))

                max_b = 6/len(min_gem)

                max_path=1/len(BVpath)

                print("最少宝石的价值性为",max_b,"目标价值为",max_path)

                if(max_path<max_b and len(BVpath)>5):#最少宝石价值高于目标宝石,且目标宝石在距离超过5步

                    BVpath = min_gem

                    print("!!!——————目标比最少宝石的价值低,寻找最少宝石",BVpath)

    return BVpath

#利用阻挡,将对方企鹅封锁在row<5范围内

    if context.players[1].row <5 :

        block_direction = api.check.next(end=(5, context.players[1].col))

    else:

        block_direction = api.check.next(end=(context.players[1].row + 1, context.players[1].col))

    return block_direction

  • 14
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
人工智能大作业-基于强化学习求解迷宫问题python实现源码+项目说明+实验报告+可执行文件 【项目介绍】 该资源内项目代码都是经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也适合小白学习进阶, 或者实际项目借鉴参考! 当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。如果基础还行,也可在此代码基础上进行修改,以实现其他功能。 强化学习求解迷宫问题 核心代码 - maze.py: 迷宫类的实现,迷宫信息用一个二维数组表示,数组中的每个数代表一个方格,数字值代表方格类型(如0表示墙, 2表示陷阱, 3表示火)。 - train_qtable.py: Q表类的实现,Q表类有Q值的存储,决策的进行,Q表的学习等功能函数,进行预测和学习时会与迷宫(“环境”)进行交互,对其输入动作,得到反馈。 - train_network.py: 监督学习模型的学习,预测等实现。 - git.py: 监督学习用到的批量式学习仓库。 - maze_map.py: 存储6个事先定义好的迷宫 - draw.py: Q表的可视化以及完整走迷宫过程的呈现。 UI代码 - ui.py: 顶层窗口,有两个标签页 - ui_basic.py: “已有迷宫”标签页的实现,用户可以从我们定义好的几个迷宫中选择一个,进行训练并查看完整的走迷宫过程。 - ui_userDefine.py:“用户自定义”标签页的实现,用户可以输入任意大小的迷宫,自定义火焰周期,训练次数上限。之后进行训练,并以三种不同的速度查看完整的走迷宫结果。 - draw_ui.py: 在ui界面绘制Q表和走迷宫过程。 运行方法 - 打开“可执行文件/ui.exe” - 运行“代码/ui.py” - 运行“代码/train_qtable.py”,对maze_map中定义的迷宫进行训练,训练结束后显示Q表和完整走迷宫过程。 编译运行环境 python 3.6, pyqt 5.13.1, matplotlib 3.0.2, numpy 1.15.2, Pyinstaller 3.5
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值