LeetCode 486. 预测赢家（记忆化搜索 / 动态规划）

最新推荐文章于 2022-05-11 21:10:03 发布

ypxpy

最新推荐文章于 2022-05-11 21:10:03 发布

阅读量275

点赞数

分类专栏： LeetCode 文章标签：算法动态规划 python leetcode 编程语言

本文链接：https://blog.csdn.net/qq_36183146/article/details/105511804

版权

LeetCode 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

LeetCode 链接

LeetCode 486

ps：最近发现记忆化搜索真的好用哈~~

一、问题描述

给定一个表示分数的非负整数数组。玩家1从数组任意一端拿取一个分数，随后玩家2继续从剩余数组任意一端拿取分数，然后玩家1拿，……。每次一个玩家只能拿取一个分数，分数被拿取之后不再可取。直到没有剩余分数可取时游戏结束。最终获得分数总和最多的玩家获胜。

给定一个表示分数的数组，预测玩家1是否会成为赢家。你可以假设每个玩家的玩法都会使他的分数最大化。

示例1：
在这里插入图片描述
示例2：

二、问题分析以及代码

一开始看到题目的时候我以为和 877. 石子游戏类似，那种巧解题目的感觉不要太爽哈，那题也是从数组左右取值，最终取值最大的获胜，不过它有不同的限定条件：数组长度为偶数，数组值总和为奇数，遇到这种题目总有种暴力解的冲动，不过一看数组长度上界为500，直接放弃想法，然而当我们冷静下来思考给定的条件再尝试模拟其过程的时候，会发现先手有优势，他能够控制对方只能拿偶数或者奇数索引下的值，换句话说先手只要先计算偶数与奇数索引下总和哪个最大（由题意知必存在，鸽巢原理），直接按照索引的奇偶性拿值，也就必赢，所以那题直接 return True。

1. 记忆化搜索

回到正题，显然此题没有那样强的限定条件，因为当数组个数为奇数时我们就很难去判断了。然而，我们再仔细看数组长度上界为20，我们又能够高兴的回到搜索的方法了，在将重复计算的子问题保存起来，问题就迎刃而解了。

因为是左右取，需要数组左右边界，用dic去保存区间 [left, right] 下玩家1能够获得的最大分数，递归函数dfs(nums, left, right) 就是去这样一个区间能够获得的最大分数。

代码（Python）

class Solution:
    def PredictTheWinner(self, nums: List[int]) -> bool:
        n = len(nums)
        total = sum(nums) 
        dic = {}

        def dfs(nums, left, right):
            if left>right:
                return 0
            if (left, right) in dic:
                return dic[(left, right)]
            curSum = sum(nums[left:right+1])
            best = max(curSum-dfs(nums, left+1, right), curSum-dfs(nums, left, right-1)) # 博弈的过程，在两种情况，让玩家1和玩家2都最优
            dic[(left, right)] = best
            return best

        player1 = dfs(nums, 0, n-1)
        return player1>=total-player1

2. 动态规划

我们同样可以使用动态规划来解决这个问题。用 dp[i, j] 表示当剩下的数为 nums[i … j] 时，当前操作的选手（注意，不一定是先手）与另一位选手最多的分数差。当前操作的选手可以选择 nums[i] 并留下 nums[i+1 … j]，或选择 nums[j] 并留下 nums[i … j-1]，因此状态转移方程为：
dp[i][j] = max(nums[i]-dp[i+1][j], nums[j]-dp[i][j-1])
dp[i][i] = nums[i]

代码（Python）

class Solution(object):
    def PredictTheWinner(self, nums):
        n = len(nums)
        dp = [[0 for i in range(n)] for j in range(n)]
        for i in range(n):
            dp[i][i] = nums[i]
        for i in range(n-1, -1, -1):
            for j in range(i+1, n):
                dp[i][j] = max(nums[i]-dp[i+1][j], nums[j]-dp[i][j-1])
        return dp[0][n-1]>=0