亚历克斯和李用几堆石子在做游戏。偶数堆石子排成一行,每堆都有正整数颗石子 piles[i] 。
游戏以谁手中的石子最多来决出胜负。石子的总数是奇数,所以没有平局。
亚历克斯和李轮流进行,亚历克斯先开始。 每回合,玩家从行的开始或结束处取走整堆石头。 这种情况一直持续到没有更多的石子堆为止,此时手中石子最多的玩家获胜。
假设亚历克斯和李都发挥出最佳水平,当亚历克斯赢得比赛时返回 true ,当李赢得比赛时返回 false 。
示例:
输入:[5,3,4,5]
输出:true
解释:
亚历克斯先开始,只能拿前 5 颗或后 5 颗石子 。
假设他取了前 5 颗,这一行就变成了 [3,4,5] 。
如果李拿走前 3 颗,那么剩下的是 [4,5],亚历克斯拿走后 5 颗赢得 10 分。
如果李拿走后 5 颗,那么剩下的是 [3,4],亚历克斯拿走后 4 颗赢得 9 分。
这表明,取前 5 颗石子对亚历克斯来说是一个胜利的举动,所以我们返回 true 。
提示:
2 <= piles.length <= 500
piles.length 是偶数。
1 <= piles[i] <= 500
sum(piles) 是奇数。
今天做动态规划终于有点感觉了,直觉上是使用二维数据进行状态的标记,但一开始想错了,使用dp[i][j]表示区间[i,j]内能够获得的最大分数,然后不知道怎么判断最后赢还是没有赢,看了题解豁然开朗,使用dp[i][j]表示区间内亚比李多获得的最多的分数,这样只要最后是正数,一定是亚赢的。
这道题还是很好转化,因为李每次也是选择最优的情况,相当于他是跟亚求解一样的问题的,可以用一个状态方程。
dp问题要不断练习转化为字问题的过程,这样思路才能打开,越来越有感觉。
贴份代码。
class Solution {
public:
bool stoneGame(vector<int>& piles) {
int dp[510][510];//dp表示在区间i,j内比李最多获得的分数
int n = piles.size();
for(int i=0;i<piles.size();i++) {
dp[i][i] = piles[i];
}
for(int k=1;k<piles.size();k++) {
int i=0,j=k;
while(j<piles.size()) {
dp[i][j] = max(piles[i]-dp[i+1][j],piles[j]-dp[i][j-1]);
i++;
j++;
}
}
return dp[0][n-1]>0;
}
};