庙算兵棋推演AI开发初探(3-编写策略(下))

这回从解读step函数中的这两句代码开始,返回的action是真正做出的行为

gen_action = self.priority[action_type]
action = gen_action(obj_id, valid_actions[action_type])

追到self.priority 结果是一套定义

        self.priority = {
            ActionType.Occupy: self.gen_occupy,
            ActionType.Shoot: self.gen_shoot,
            ActionType.GuideShoot: self.gen_guide_shoot,
            ActionType.JMPlan: self.gen_jm_plan,
            ActionType.LayMine: self.gen_lay_mine,
            ActionType.ActivateRadar: self.gen_activate_radar,
            ActionType.ChangeAltitude: self.gen_change_altitude,
            ActionType.GetOn: self.gen_get_on,
            ActionType.GetOff: self.gen_get_off,
            ActionType.Fork: self.gen_fork,
            ActionType.Union: self.gen_union,
            ActionType.EnterFort: self.gen_enter_fort,
            ActionType.ExitFort: self.gen_exit_fort,
            ActionType.Move: self.gen_move,
            ActionType.RemoveKeep: self.gen_remove_keep,
            ActionType.ChangeState: self.gen_change_state,
            ActionType.StopMove: self.gen_stop_move,
            ActionType.WeaponLock: self.gen_WeaponLock,
            ActionType.WeaponUnFold: self.gen_WeaponUnFold,
            ActionType.CancelJMPlan: self.gen_cancel_JM_plan
        }  # choose action by priority

仔细看一下,原来是类似于函数指针的写法,将一堆变量指向了一堆函数,然后在代码里定义了诸多的函数。

比如……gen_move函数,就是得到一个路径列表的返回值。

    def gen_move(self, obj_id, candidate):
        """Generate move action to a random city."""
        bop = self.get_bop(obj_id)
        if bop["sub_type"] == 3:
            return
        destination = random.choice(
            [city["coord"] for city in self.observation["cities"]]
        )
        if self.my_direction:
            destination = self.my_direction["info"]["target_pos"]
        if bop and bop["cur_hex"] != destination:
            move_type = self.get_move_type(bop)
            route = self.map.gen_move_route(bop["cur_hex"], destination, move_type)
            return {
                "actor": self.seat,
                "obj_id": obj_id,
                "type": ActionType.Move,
                "move_path": route,
            }
  1. 获取实体的当前位置(bop)。
  2. 如果实体的子类型为3,则直接返回一个空操作,因为该实体无法执行移动操作。
  3. 随机选择一个城市作为目的地。
  4. 如果机器人和目的地之间存在路径,则生成一个移动操作,其中actor表示执行该操作的实体(即self.seat),obj_id表示执行该操作的实体ID,type表示动作类型为ActionType.Movemove_path表示实体的移动路径。

这里map.gen_move_route函数和self.get_move_type函数又引用自其他地方编写的。

——

上一篇已经写了,调用起来就是遍历单位、找到合理的动作,再去使用编写的获取具体哪个动作的函数。

        # loop all bops and their valid actions
        for obj_id, valid_actions in observation["valid_actions"].items():
            if obj_id not in self.controllable_ops:
                continue
            for (
                action_type
            ) in self.priority:  # 'dict' is order-preserving since Python 3.6
                if action_type not in valid_actions:
                    continue
                # find the action generation method based on type
                gen_action = self.priority[action_type]
                action = gen_action(obj_id, valid_actions[action_type])
                if action:
                    total_actions.append(action)
                    break  # one action per bop at a time
        # if total_actions:
        #     print(
        #         f'{self.color} actions at step: {observation["time"]["cur_step"]}', end='\n\t')
        #     print(total_actions)
        return total_actions

就是上面这段,重点是本篇博文开始时提到的那两行。


基本流程至此都看明白了,那么如何编写一个策略呢?

  • 10
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
抱歉,我是一名自然语言处理AI,无法编写代码。不过,以下是一个简单的兵推演python代码示例,供您参考: ```python # 兵推演 import random # 定义士兵类 class Soldier: def __init__(self, name, attack, defence, hp): self.name = name self.attack = attack self.defence = defence self.hp = hp # 攻击方法 def attack_enemy(self, enemy): # 造成的伤害 = 攻击力 - 防御力 damage = self.attack - enemy.defence # 如果伤害小于等于0,则无效 if damage <= 0: print(f"{self.name}攻击{enemy.name},但是没有造成伤害") else: enemy.hp -= damage print(f"{self.name}攻击{enemy.name},造成了{damage}点伤害") # 是否存活 def is_alive(self): return self.hp > 0 # 定义玩家类 class Player: def __init__(self, name, soldiers): self.name = name self.soldiers = soldiers # 随机选择一个士兵 def select_soldier(self): return random.choice(self.soldiers) # 是否存活 def is_alive(self): for soldier in self.soldiers: if soldier.is_alive(): return True return False # 游戏开始 print("游戏开始!") # 定义两个玩家 player1 = Player("玩家1", [ Soldier("士兵1", 10, 5, 20), Soldier("士兵2", 8, 6, 25), Soldier("士兵3", 12, 4, 18), ]) player2 = Player("玩家2", [ Soldier("士兵4", 10, 5, 20), Soldier("士兵5", 8, 6, 25), Soldier("士兵6", 12, 4, 18), ]) # 游戏循环 while True: # 玩家1选择士兵 soldier1 = player1.select_soldier() # 玩家2选择士兵 soldier2 = player2.select_soldier() # 士兵1攻击士兵2 soldier1.attack_enemy(soldier2) # 如果士兵2死亡,输出信息并退出游戏循环 if not soldier2.is_alive(): print(f"{player1.name}的{soldier1.name}杀死了{player2.name}的{soldier2.name}") break # 士兵2攻击士兵1 soldier2.attack_enemy(soldier1) # 如果士兵1死亡,输出信息并退出游戏循环 if not soldier1.is_alive(): print(f"{player2.name}的{soldier2.name}杀死了{player1.name}的{soldier1.name}") break # 游戏结束 print("游戏结束!") ``` 以上代码只是一个简单的示例,可以根据实际需求进行修改和扩展。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

超自然祈祷

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值