Leetcode1728. 猫和老鼠 II(difficult)

1. 问题描述

一只猫和一只老鼠在玩一个叫做猫和老鼠的游戏。

它们所处的环境设定是一个 rows x cols 的方格 grid ,其中每个格子可能是一堵墙、一块地板、一位玩家(猫或者老鼠)或者食物。

  • 玩家由字符 'C' (代表猫)和 'M' (代表老鼠)表示。
  • 地板由字符 '.' 表示,玩家可以通过这个格子。
  • 墙用字符 '#' 表示,玩家不能通过这个格子。
  • 食物用字符 'F' 表示,玩家可以通过这个格子。
  • 字符 'C' , 'M' 和 'F' 在 grid 中都只会出现一次。

猫和老鼠按照如下规则移动:

  • 老鼠 先移动 ,然后两名玩家轮流移动。
  • 每一次操作时,猫和老鼠可以跳到上下左右四个方向之一的格子,他们不能跳过墙也不能跳出 grid 。
  • catJump 和 mouseJump 是猫和老鼠分别跳一次能到达的最远距离,它们也可以跳小于最大距离的长度。
  • 它们可以停留在原地。
  • 老鼠可以跳跃过猫的位置。

游戏有 4 种方式会结束:

  • 如果猫跟老鼠处在相同的位置,那么猫获胜。
  • 如果猫先到达食物,那么猫获胜。
  • 如果老鼠先到达食物,那么老鼠获胜。
  • 如果老鼠不能在 1000 次操作以内到达食物,那么猫获胜。

给你 rows x cols 的矩阵 grid 和两个整数 catJump 和 mouseJump ,双方都采取最优策略,如果老鼠获胜,那么请你返回 true ,否则返回 false 。

示例 1:

输入:grid = ["####F","#C...","M...."], catJump = 1, mouseJump = 2
输出:true
解释:猫无法抓到老鼠,也没法比老鼠先到达食物。

示例 2:

输入:grid = ["M.C...F"], catJump = 1, mouseJump = 4
输出:true

示例 3:

输入:grid = ["M.C...F"], catJump = 1, mouseJump = 3
输出:false

示例 4:

输入:grid = ["C...#","...#F","....#","M...."], catJump = 2, mouseJump = 5
输出:false

示例 5:

输入:grid = [".M...","..#..","#..#.","C#.#.","...#F"], catJump = 3, mouseJump = 1
输出:true

提示:

  • rows == grid.length
  • cols = grid[i].length
  • 1 <= rows, cols <= 8
  • grid[i][j] 只包含字符 'C' ,'M' ,'F' ,'.' 和 '#' 。
  • grid 中只包含一个 'C' ,'M' 和 'F' 。
  • 1 <= catJump, mouseJump <= 8

2. 思路与算法

2.1 前言


        这道题是「913. 猫和老鼠」的进阶,建议读者在阅读本文之前首先阅读「913. 猫和老鼠的官方题解」,了解博弈问题中的必胜状态、必败状态与必和状态的概念,以及最优策略。

        博弈问题通常可以使用动态规划求解。由于动态规划的时间复杂度和游戏轮数有关,因此动态规划的时间复杂度较高。本文不具体介绍动态规划的解法,感兴趣的读者可以自行尝试。

        博弈问题的另一种解法是拓扑排序。和动态规划相比,拓扑排序的时间复杂度和游戏轮数无关,因此拓扑排序的时间复杂度较低。

2.2 算法概述

        给定的网格包含 \textit{rows} 行和 \textit{cols} 列,网格中的单元格总数是 \textit{total} = \textit{rows} \times \textit{cols}。每个单元格对应一个编号,第 i 行第 j 列的单元格编号是i \times \textit{cols} + j,其中 0 \le i < \textit{rows}0 \le j < \textit{cols}

        首先遍历网格,得到猫和老鼠初始时所在的单元格以及食物所在的单元格,然后计算获胜方。(什么鬼?没看懂

2.3 求解简化问题

        这道题规定了移动次数上限为 1000,如果在 1000 次移动之内老鼠不能获胜,则猫获胜。可以首先考虑一个简化问题,在没有移动次数上限的情况下计算获胜方。该简化问题可以使用拓扑排序得到结果。

        游戏中的状态由老鼠的位置、猫的位置和轮到移动的一方三个因素决定。初始时,只有边界情况的胜负结果已知,其余所有状态的结果都初始化为未知。边界情况为直接确定胜负的情况,包括三种情况:

  • 猫和老鼠在同一个单元格,无论在哪个单元格,都是猫获胜;
  • 猫和食物在同一个单元格,无论老鼠在哪个单元格,都是猫获胜;
  • 老鼠和食物在同一个单元格,只要猫和食物不在同一个单元格,无论猫在哪个单元格,都是老鼠获胜。

        从边界情况出发遍历其他情况。对于当前状态,可以得到老鼠所在的单元格、猫所在的单元格和轮到移动的一方,根据当前状态可知上一轮的所有可能状态,其中上一轮的移动方和当前的移动方相反,上一轮的移动方在上一轮状态和当前状态所在的单元格相同或不同(注意可以停留在原地)。假设当前状态是老鼠所在的单元格编号是 \textit{mouse},猫所在的单元格编号是 \textit{cat},则根据当前的移动方,可以得到上一轮的所有可能状态:

  • 如果当前的移动方是老鼠,则上一轮的移动方是猫,上一轮状态中老鼠所在的单元格编号是 \textit{mouse},猫所在的单元格编号可能是 \textit{cat} 或者向四个方向之一跳跃到达的单元格编号,跳跃的距离不超过 \textit{catJump}且不能跳过墙及不能跳出网格;
  • 如果当前的移动方是猫,则上一轮的移动方是老鼠,上一轮状态中猫所在的单元格编号是 \textit{cat},老鼠所在的单元格编号可能是 \textit{mouse}或者向四个方向之一跳跃到达的单元格编号,跳跃的距离不超过 \textit{mouseJump}且不能跳过墙及不能跳出网格。

        对于上一轮的每一种可能的状态,如果该状态的结果已知,则不需要重复计算该状态的结果,只有对结果未知的状态,才需要计算该状态的结果。对于上一轮的移动方,只有当可以确定上一轮状态是必胜状态或者必败状态时,才更新上一轮状态的结果。

  • 如果上一轮的移动方和当前状态的获胜方相同,由于当前状态为上一轮的移动方的必胜状态,因此上一轮的移动方一定可以移动到当前状态而获胜,上一轮状态为上一轮的移动方的必胜状态。
  • 如果上一轮的移动方和当前状态的获胜方不同,则上一轮的移动方需要尝试其他可能的移动,可能有以下三种情况:
    • 如果存在一种移动可以到达上一轮的移动方的必胜状态,则上一轮状态为上一轮的移动方的必胜状态;
    • 如果所有的移动都到达上一轮的移动方的必败状态,则上一轮状态为上一轮的移动方的必败状态;
    • 如果所有的移动都不能到达上一轮的移动方的必胜状态,但是存在一种移动可以到达上一轮的移动方的未知状态,则上一轮状态为上一轮的移动方的未知状态。

        其中,对于必败状态与未知状态的判断依据为上一轮的移动方可能的移动是都到达必败状态还是可以到达未知状态。为了实现必败状态与未知状态的判断,需要记录每个状态的度,初始时每个状态的度为当前玩家在当前单元格可以到达的单元格数,由于可以停留在原地,因此初始时每个状态的度为当前玩家在当前单元格可以跳跃到达的单元格数加 1。

        遍历过程中,从当前状态出发遍历上一轮的所有可能状态,如果上一轮状态的结果未知且上一轮的移动方和当前状态的获胜方不同,则将上一轮状态的度减 1。如果上一轮状态的度减少到 0,则从上一轮状态出发到达的所有状态都是上一轮的移动方的必败状态,因此上一轮状态也是上一轮的移动方的必败状态。

        在确定上一轮状态的结果(必胜或必败)之后,即可从上一轮状态出发,遍历其他的未知状态。当没有更多的状态可以确定胜负结果时,遍历结束,此时即可得到初始状态的结果。

2.4 求解原始问题

        上述解法为简化问题的解法,没有考虑移动次数的上限。由于移动次数的限制只会影响到平局以及老鼠获胜的条件,因此只需要对平局和老鼠获胜的情况考虑移动次数。

        平局对应上述解法中的未知状态,表示当猫和老鼠都按照最优策略参与游戏时,双方都无法在有限的移动次数内到达食物所在的单元格,移动次数一定会超过老鼠获胜的上限,因此未知状态对应的结果都是猫获胜。

        如果在简化问题中,从初始状态开始游戏的结果是老鼠获胜,即老鼠先到达食物,则在原始问题中,需要计算从初始状态至老鼠到达食物的移动次数,只有当移动次数不超过 1000 时,老鼠才能获胜,否则猫获胜。

        为了计算从初始状态至老鼠到达食物的移动次数,在拓扑排序的过程中除了记录每个状态的结果以外,还需要记录从边界情况到达每个状态的移动次数,等价于从每个状态到边界情况的移动次数。每个状态对应的移动次数计算方法如下:

        边界情况可以直接确定胜负,因此移动次数为 0;

        如果状态 s_1和状态 s_2相邻(即状态s_2是状态s_1的上一轮的状态之一),且状态s_1的结果和移动次数已知,记状态s_1的移动次数为 x,如果可以确定状态s_2的结果,则状态s_2的移动次数为 x + 1

证明

        对于上述解法的正确性证明,需要证明两点,一是未知状态的正确性,二是移动次数的正确性。

证明一:未知状态的正确性

        遍历结束之后,如果一个状态的结果未知,则该状态满足以下两个条件:

  • 从该状态出发,任何移动都无法到达该状态的移动方的必胜状态;
  • 从该状态出发,存在一种移动可以到达未知状态。

        对于结果未知的状态,如果其实际结果是该状态的移动方必胜,则一定存在一个下一轮状态,为当前状态的移动方的必胜状态,在根据下一轮状态的结果标记当前状态的结果时会将当前状态标记为当前状态的移动方的必胜状态,和结果未知矛盾。

        对于结果未知的状态,如果其实际结果是该状态的移动方必败,则所有的下一轮状态都为当前状态的移动方的必败状态,在根据下一轮状态的结果标记当前状态的结果时会将当前状态标记为当前状态的移动方的必败状态,和结果未知矛盾。

        因此,对于结果不是任何一方必胜的状态,实际结果一定是未知。根据游戏规则,未知状态表示在该状态下当猫和老鼠都按照最优策略参与游戏时,双方都无法在有限的移动次数内到达食物所在的单元格,移动次数一定会超过老鼠获胜的上限,因此未知状态对应的结果都是猫获胜。

证明二:移动次数的正确性

        在考虑移动次数的情况下,每个玩家的最优策略应满足以下三点:

  • 当自己可以到达必胜状态时,应将移动次数最小化;
  • 当自己无法到达必胜状态时,如果可以避免自己到达必败状态,则应到达未知状态;
  • 当无法避免自己到达必败状态时,应将移动次数最大化。

        由于拓扑排序的实现方式是广度优先搜索,因此拓扑排序的过程中遍历状态的顺序为移动次数递增的顺序。

        边界情况的移动次数为 0。从已知状态出发计算未知状态的结果和移动次数,将已知状态记为 s_1,未知状态记为 s_2,且状态s_1和状态s_2相邻(即状态 s_2是状态s_1的上一轮的状态之一),记状态s_1的移动次数为 x,考虑以下两种情况。

  • 如果状态s_2的移动方和状态s_1的获胜方相同,则状态s_2的移动方会移动到状态s_1从而确保胜利,因此状态s_2的移动方必胜,移动次数为 x + 1,且该移动次数为状态s_2到边界情况的最少移动次数。
    • 假设存在另一个已知状态 s_3的获胜方和状态s_1相同且状态s_3的移动次数小于 x,则状态s_3在状态s_1之前被遍历,在遍历到状态s_3时就会更新状态s_2的结果,和遍历到状态s_1时状态s_2的结果未知矛盾。因此状态s_2的最少移动次数为x + 1
  •  如果状态s_2的移动方和状态s_1的获胜方不同,则只有当状态s_2的所有相邻状态都已知是状态s_2的移动方的必败状态时,才能确定状态s_2的移动方必败。如果在遍历到状态s_1时可以确定状态s_2的结果为移动方必败,则在遍历到状态s_1之前,状态s_2的所有相邻状态都已经遍历过,即状态s_1是最后一个遍历到的状态s_2的相邻状态,因此在状态s_2的所有相邻状态中,状态s_1的移动次数最多,状态s_2的移动次数是x + 1 符合必败状态下将移动次数最大化。

作者:LeetCode-Solution
链接:https://leetcode.cn/problems/cat-and-mouse-ii/solution/mao-he-lao-shu-ii-by-leetcode-solution-e5io/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

3. 代码实现

 

MOUSE_TURN = 0
CAT_TURN = 1
UNKNOWN = 0
MOUSE_WIN = 1
CAT_WIN = 2
MAX_MOVES = 1000
DIRS = ((-1, 0), (1, 0), (0, -1), (0, 1))

class Solution:
    def canMouseWin(self, grid: List[str], catJump: int, mouseJump: int) -> bool:
        rows, cols = len(grid), len(grid[0])

        def getPos(row: int, col: int) -> int:
            return row * cols + col

        startMouse = startCat = food = 0
        for i, row in enumerate(grid):
            for j, ch in enumerate(row):
                if ch == 'M':
                    startMouse = getPos(i, j)
                elif ch == 'C':
                    startCat = getPos(i, j)
                elif ch == 'F':
                    food = getPos(i, j)

        # 计算每个状态的度
        total = rows * cols
        degrees = [[[0, 0] for _ in range(total)] for _ in range(total)]
        for mouse in range(total):
            mouseRow, mouseCol = divmod(mouse, cols)
            if grid[mouseRow][mouseCol] == '#':
                continue
            for cat in range(total):
                catRow, catCol = divmod(cat, cols)
                if grid[catRow][catCol] == '#':
                    continue
                degrees[mouse][cat][MOUSE_TURN] += 1
                degrees[mouse][cat][CAT_TURN] += 1
                for dx, dy in DIRS:
                    row, col, jump = mouseRow + dx, mouseCol + dy, 1
                    while 0 <= row < rows and 0 <= col < cols and grid[row][col] != '#' and jump <= mouseJump:
                        nextMouse = getPos(row, col)
                        nextCat = getPos(catRow, catCol)
                        degrees[nextMouse][nextCat][MOUSE_TURN] += 1
                        row += dx
                        col += dy
                        jump += 1
                    row, col, jump = catRow + dx, catCol + dy, 1
                    while 0 <= row < rows and 0 <= col < cols and grid[row][col] != '#' and jump <= catJump:
                        nextMouse = getPos(mouseRow, mouseCol)
                        nextCat = getPos(row, col)
                        degrees[nextMouse][nextCat][CAT_TURN] += 1
                        row += dx
                        col += dy
                        jump += 1

        results = [[[[0, 0], [0, 0]] for _ in range(total)] for _ in range(total)]
        q = deque()

        # 猫和老鼠在同一个单元格,猫获胜
        for pos in range(total):
            row, col = divmod(pos, cols)
            if grid[row][col] == '#':
                continue
            results[pos][pos][MOUSE_TURN][0] = CAT_WIN
            results[pos][pos][MOUSE_TURN][1] = 0
            results[pos][pos][CAT_TURN][0] = CAT_WIN
            results[pos][pos][CAT_TURN][1] = 0
            q.append((pos, pos, MOUSE_TURN))
            q.append((pos, pos, CAT_TURN))

        # 猫和食物在同一个单元格,猫获胜
        for mouse in range(total):
            mouseRow, mouseCol = divmod(mouse, cols)
            if grid[mouseRow][mouseCol] == '#' or mouse == food:
                continue
            results[mouse][food][MOUSE_TURN][0] = CAT_WIN
            results[mouse][food][MOUSE_TURN][1] = 0
            results[mouse][food][CAT_TURN][0] = CAT_WIN
            results[mouse][food][CAT_TURN][1] = 0
            q.append((mouse, food, MOUSE_TURN))
            q.append((mouse, food, CAT_TURN))

        # 老鼠和食物在同一个单元格且猫和食物不在同一个单元格,老鼠获胜
        for cat in range(total):
            catRow, catCol = divmod(cat, cols)
            if grid[catRow][catCol] == '#' or cat == food:
                continue
            results[food][cat][MOUSE_TURN][0] = MOUSE_WIN
            results[food][cat][MOUSE_TURN][1] = 0
            results[food][cat][CAT_TURN][0] = MOUSE_WIN
            results[food][cat][CAT_TURN][1] = 0
            q.append((food, cat, MOUSE_TURN))
            q.append((food, cat, CAT_TURN))

        def getPrevStates(mouse: int, cat: int, turn: int) -> List[Tuple[int, int, int]]:
            mouseRow, mouseCol = divmod(mouse, cols)
            catRow, catCol = divmod(cat, cols)
            prevTurn = CAT_TURN if turn == MOUSE_TURN else MOUSE_TURN
            maxJump = mouseJump if prevTurn == MOUSE_TURN else catJump
            startRow = mouseRow if prevTurn == MOUSE_TURN else catRow
            startCol = mouseCol if prevTurn == MOUSE_TURN else catCol
            prevStates = [(mouse, cat, prevTurn)]
            for dx, dy in DIRS:
                i, j, jump = startRow + dx, startCol + dy, 1
                while 0 <= i < rows and 0 <= j < cols and grid[i][j] != '#' and jump <= maxJump:
                    prevMouseRow = i if prevTurn == MOUSE_TURN else mouseRow
                    prevMouseCol = j if prevTurn == MOUSE_TURN else mouseCol
                    prevCatRow = catRow if prevTurn == MOUSE_TURN else i
                    prevCatCol = catCol if prevTurn == MOUSE_TURN else j
                    prevMouse = getPos(prevMouseRow, prevMouseCol)
                    prevCat = getPos(prevCatRow, prevCatCol)
                    prevStates.append((prevMouse, prevCat, prevTurn))
                    i += dx
                    j += dy
                    jump += 1
            return prevStates

        # 拓扑排序
        while q:
            mouse, cat, turn = q.popleft()
            result = results[mouse][cat][turn][0]
            moves = results[mouse][cat][turn][1]
            for prevMouse, prevCat, prevTurn in getPrevStates(mouse, cat, turn):
                if results[prevMouse][prevCat][prevTurn][0] == UNKNOWN:
                    if result == MOUSE_WIN and prevTurn == MOUSE_TURN or result == CAT_WIN and prevTurn == CAT_TURN:
                        results[prevMouse][prevCat][prevTurn][0] = result
                        results[prevMouse][prevCat][prevTurn][1] = moves + 1
                        q.append((prevMouse, prevCat, prevTurn))
                    else:
                        degrees[prevMouse][prevCat][prevTurn] -= 1
                        if degrees[prevMouse][prevCat][prevTurn] == 0:
                            loseResult = CAT_WIN if prevTurn == MOUSE_TURN else MOUSE_WIN
                            results[prevMouse][prevCat][prevTurn][0] = loseResult
                            results[prevMouse][prevCat][prevTurn][1] = moves + 1
                            q.append((prevMouse, prevCat, prevTurn))
        return results[startMouse][startCat][MOUSE_TURN][0] == MOUSE_WIN and results[startMouse][startCat][MOUSE_TURN][1] <= MAX_MOVES

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

笨牛慢耕

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值