stone game 887

21 篇文章 0 订阅

leetcode 887

亚历克斯和李用几堆石子在做游戏。偶数堆石子排成一行,每堆都有正整数颗石子 piles[i] 。

游戏以谁手中的石子最多来决出胜负。石子的总数是奇数,所以没有平局。

亚历克斯和李轮流进行,亚历克斯先开始。 每回合,玩家从行的开始或结束处取走整堆石头。 这种情况一直持续到没有更多的石子堆为止,此时手中石子最多的玩家获胜。

假设亚历克斯和李都发挥出最佳水平,当亚历克斯赢得比赛时返回 true ,当李赢得比赛时返回 false 。

 

示例:

输入:[5,3,4,5]
输出:true
解释:
亚历克斯先开始,只能拿前 5 颗或后 5 颗石子 。
假设他取了前 5 颗,这一行就变成了 [3,4,5] 。
如果李拿走前 3 颗,那么剩下的是 [4,5],亚历克斯拿走后 5 颗赢得 10 分。
如果李拿走后 5 颗,那么剩下的是 [3,4],亚历克斯拿走后 4 颗赢得 9 分。
这表明,取前 5 颗石子对亚历克斯来说是一个胜利的举动,所以我们返回 true 。

提示:


    2 <= piles.length <= 500
    piles.length 是偶数。
    1 <= piles[i] <= 500
    sum(piles) 是奇数

 

暴力求解,每次奇偶转换,每次是不同的人取前后端的值,最终start==end ,判断两个人取得的值的大小

但超时

public: 
   bool helper(vector<int>& piles, int start,int end,int& p1,int& p2)//这里使用引用,在java里要换成全局变量
{
    if(start == end)
        return p1 > p2 ? true : false;
    
    int sum1,sum2;
    if((start+end)%2 == 0)//第二个人取值
    {
        sum1 = p2+piles[start];
        sum2 = p2+piles[end];
        return helper(piles,start+1,end,p1,sum1) ||
               helper(piles,start,end-1,p1,sum2);
    }
    else //alex取值
    {
        sum1 = p1+piles[start];
        sum2 = p1+piles[end];
        return helper(piles,start+1,end,sum1,p2) ||
               helper(piles,start,end-1,sum2,p2);
    }
    
}
bool stoneGame(vector<int>& piles) {
    int p1,p2;
    p1=p2=0;
    return helper(piles,0,piles.size()-1,p1,p2);
}

找数学逻辑规律

/*
    由于是偶数堆,奇数个石头,所以总有人多拿,有人少拿到
    由于两个人都是聪明的,用最优秀策略,只要有一种可能使得A最终win,就返回true.所以先手拿的的人可以通过看所有情况,选择对自己最有利的。例如 一直选偶数位值或奇数位的值
     */
    public boolean stoneGame1(int[] piles){
        return true;
    }
/*
方法2 先排序,每次都选最大的值给alex
*/

public boolean stoneGame2(int[] piles) {

        int Alex = 0;
        int Lee = 0;

        Arrays.sort(piles);
        int i=piles.length-1;
        while(i >=0){
            Alex += piles[i--];
            Lee += piles[i--];
        }

        return Alex > Lee;
    }
//动态规划,更加通用的解法

  /*
    我们每次只能拿两端的石头堆的石头,但我们又不知道拿完后剩下的石头堆的情况,因此我们考虑先解决子问题。例如我们求出2个相邻石头堆的胜负情况,
    我们可以根据求出的数据求出相邻3个石头堆的胜负情况,以此类推,我们可以根据n-1个相邻石头堆的胜负情况,求出n个相邻石头堆的胜负情况,
    即我们的原问题。
根据我们的类推我们可以设dp[i][j]为piles[i]~piles[j]Alex最多可以赢Lee的分数。每次取石头堆只能从两端取,
因此:dp[i][j] = max(piles[i] - dp[i+1][j], piles[j] - dp[i][j-1])。其中
piles[i] - dp[i+1][j]表示Alex取走i上的石头堆,piles[j] - dp[i][j-1]表示Alex取走的是j上的石头堆。
注意,为什么dp[i+1][j]表示piles[i+1]~piles[j]之间Alex最多可以赢Lee的分数,而piles[i]要减去该值而不是加上该值呢?由于我们的要求是每一步Alex和Lee采取的都是最优策略,当取piles[i]时,piles[i+1]~piles[j]中Alex和Lee的走法会调换。意即Lee走Alex的走法,Alex走Lee的走法,因此这里要做减法。

    比如说有4个石头堆 1 3 3 4
    1 3, 3 3,3 4
    1 3 3, 3 3 4
    1 3 3 4
     */
    public boolean stoneGame(int[] piles) {
        int len=piles.length;
        int dp[][]=new int[len][len];
        for(int i=0;i<len;i++){
            dp[i][i]=piles[i];初始化只有i一个石头堆的情形
        }
        for(int i=1;i<len;i++){
            for(int j=0;j<len-i;j++){
                dp[j][j+i]=Math.max(piles[j]-dp[j+1][j+i],piles[j+i]-dp[i][j+i-1]);//依次计算相邻2个石头堆到n个石头堆的情形
            }
        }
        return dp[0][len-1]>0;
    }

    

动态规划的解释可以看这个链接是图像化解释,其中还有空间优化的解释

//空间优化
    public boolean stoneGame_0(int[] piles) {
        int len=piles.length;
        int dp[]=new int[len];
        for(int i=0;i<len;i++){
            dp[i]=piles[i];
        }
        for(int i=1;i<len;i++) {
            for (int j = 0; j < len - i; j++) {
                dp[j] = Math.max(piles[j] - dp[j + 1], piles[j + i] - dp[i]);
            }
        }
            return dp[len-1]>0;
    }

另外 动态规划,

/*思路
让我们改变游戏规则,使得每当李得分时,都会从亚历克斯的分数中扣除。
令 dp(i, j) 为亚历克斯可以获得的最大分数,其中剩下的堆中的石子数是 piles[i], piles[i+1], ..., piles[j]。
这在比分游戏中很自然:我们想知道游戏中每个位置的值。
我们可以根据 dp(i + 1,j) 和 dp(i,j-1) 来制定 dp(i,j) 的递归,我们可以使用动态编程以不重复这个递归中的工作。该方法可以输出正确的答案,因为状态形成一个DAG(有向无环图)。
算法
当剩下的堆的石子数是 piles[i], piles[i+1], ..., piles[j] 时,轮到的玩家最多有 2 种行为。
可以通过比较 j-i和 N modulo 2 来找出轮到的人。
如果玩家是亚历克斯,那么她将取走 piles[i] 或 piles[j] 颗石子,增加她的分数。
之后,总分为 piles[i] + dp(i+1, j) 或 piles[j] + dp(i, j-1);我们想要其中的最大可能得分。
如果玩家是李,那么他将取走 piles[i] 或 piles[j] 颗石子,减少亚历克斯这一数量的分数。
之后,总分为 -piles[i] + dp(i+1, j) 或 -piles[j] + dp(i, j-1);我们想要其中的最小可能得分。
*/

public boolean stoneGame(int[] piles) {
        int N = piles.length;

        // dp[i+1][j+1] = the value of the game [piles[i], ..., piles[j]].
        int[][] dp = new int[N+2][N+2];
        for (int size = 1; size <= N; ++size)
            for (int i = 0; i + size <= N; ++i) {
                int j = i + size - 1;
                int parity = (j + i + N) % 2;  // j - i - N; but +x = -x (mod 2)
                if (parity == 1)
                    dp[i+1][j+1] = Math.max(piles[i] + dp[i+2][j+1], piles[j] + dp[i+1][j]);
                else
                    dp[i+1][j+1] = Math.min(-piles[i] + dp[i+2][j+1], -piles[j] + dp[i+1][j]);
            }

        return dp[1][N] > 0;
    }

用dp[i][j]表示alex获得的剩余的值

 

递归+记忆

通过,比上面的递归快很多

 private int[] sum;
    private int[][] hash;

    public boolean stoneGame(int[] piles) {
        int n = piles.length;
        sum = new int[n+1];
        for (int i = n - 1; i >= 0; i--)
            sum[i] = sum[i+1] + piles[i];
        hash = new int[n][n];
        int max = helper(piles, 0, n-1);
        return max > sum[0] - max;
    }

    private int helper(int[] piles, int start, int end) {
        if (start == end) return piles[start];
        if (hash[start][end] != 0) return hash[start][end];
        int all = sum[start] - sum[end+1];
        int left = all - helper(piles, start+1, end);
        int right = all - helper(piles, start, end-1);
        hash[start][end] = Math.max(left, right);
        return hash[start][end];
    }

进阶 stone game ii

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值