题目
石子游戏2
亚历克斯和李继续他们的石子游戏。许多堆石子 排成一行,每堆都有正整数颗石子 piles[i]。游戏以谁手中的石子最多来决出胜负。
亚历克斯和李轮流进行,亚历克斯先开始。最初,M = 1。
在每个玩家的回合中,该玩家可以拿走剩下的 前 X 堆的所有石子,其中 1 <= X <= 2M。然后,令 M = max(M, X)。
游戏一直持续到所有石子都被拿走。
假设亚历克斯和李都发挥出最佳水平,返回亚历克斯可以得到的最大数量的石头。
示例
输入:piles = [2,7,9,4,4]
输出:10
解释:
如果亚历克斯在开始时拿走一堆石子,李拿走两堆,接着亚历克斯也拿走两堆。在这种情况下,亚历克斯可以拿到 2 + 4 + 4 = 10 颗石子。
如果亚历克斯在开始时拿走两堆石子,那么李就可以拿走剩下全部三堆石子。在这种情况下,亚历克斯可以拿到 2 + 7 = 9 颗石子。
所以我们返回更大的 10。
思路分析
- 令dp[i][M]表示,目前还剩下标从i开始的石子堆,且数值范围为M的情况下,当前可以取到的最多的石子。X的范围是从1-2*M.
- 前提是剩下的石子取不完,如果取了x堆,那么这个时候,状态就转移到了i = i+x, M = max(M,x),此时可以取到的石子就是当前总和-dp[i+x][max(M,x)]。如果剩下的石子取完了,那么直接累加结果就好了。
代码
class Solution {
public:
int stoneGameII(vector<int>& piles) {
int n = piles.size(), sum = 0;
vector<vector<int>> dp(n, vector<int>(n + 1, 0));
// vector<vector<int>> pos(n, vector<int>(n + 1, 0));
for(int i = n - 1;i >= 0;i--){
sum += piles[i];
for(int M = 1;M <= n;M++){
if(i + 2 * M >= n){
dp[i][M] = sum;
// pos[i][M] = n;
}else{
for(int x = 1; x <= 2 * M;x ++){
if(sum - dp[i + x][max(M, x)] > dp[i][M]){
dp[i][M] = sum - dp[i + x][max(M, x)];
// pos[i][M] = x;
}
}
}
}
// cout<<"##########################"<<endl;
// for(int p = 0;p < n;p++){
// for(int q = 1;q <= n;q++)
// cout<<dp[p][q]<<" ";
// cout<<endl;
// }
// cout<<"##########################"<<endl;
}
// for(int p = 0;p < n;p++){
// for(int q = 1;q <= n;q++)
// cout<<pos[p][q]<<" ";
// cout<<endl;
// }
return dp[0][1];
}
};
dp数组的变化情况
对于[2,7,9,4,4]打印每一轮的数组的变化情况。
##########################
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
4 4 4 4 4
##########################
##########################
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
8 8 8 8 8
4 4 4 4 4
##########################
##########################
0 0 0 0 0
0 0 0 0 0
13 17 17 17 17
8 8 8 8 8
4 4 4 4 4
##########################
##########################
0 0 0 0 0
16 24 24 24 24
13 17 17 17 17
8 8 8 8 8
4 4 4 4 4
##########################
##########################
10 22 26 26 26
16 24 24 24 24
13 17 17 17 17
8 8 8 8 8
4 4 4 4 4
##########################
因此最后dp的结果是
10 22 26 26 26
16 24 24 24 24
13 17 17 17 17
8 8 8 8 8
4 4 4 4 4
举个例子,例如当第四轮的时候,i = 1.此时dp的初始状态是
0 0 0 0 0
0 0 0 0 0
13 17 17 17 17
8 8 8 8 8
4 4 4 4 4
。当 M>1时,x>2,可以取完剩下所有的石头,因此此时dp数组是从7+9+4+4=24.当M=1,x可取1或者2,证明可以取[7],或者取[7,9].因此此时的最大值就是24-dp[2][max(1,1)]=7,24-dp[3][max(1,2)]=24-8=16中的更大,也就是16.此时dp[1][1]=16.这就说明对于第二轮的人,如果此时M=1,那么最优结果是取两个。那么dp方程就变成了
0 0 0 0 0
16 24 24 24 24
13 17 17 17 17
8 8 8 8 8
4 4 4 4 4