题目描述
解题思路
标准的博弈问题:
- 方法:动态规划
- 设计:使用函数dp(i,m)进行递归求解——dp(i,m)表示当M=m,选手在i处取得的最大值
- 思路:
sum:到石子堆的最后所有堆的石子的数量
max:curr-player在(index=i,M=m)时取得的最大值
an: another-player在curr-player取完后,对剩下的堆进行选取所得的值
——联系:max = sum - min(a1,a2,…,a2m) - 对手的最小值–min(a1,a2,…,a2m):从1到2m遍历,求最小值。如下图@huahualeetcode:
x | 选手(开始index) | 对手(开始index) |
---|---|---|
1 | s | s+1 |
2 | s | s+2 |
… | … | … |
2m | s | s+2m |
x即为当前选手取的堆数。
代码
使用缓存/memo 记录结果进行优化
注意:M会改变
java
public int stoneGameII(int[] p) {
int n = p.length;
Map<Integer,Integer>[] map = new Map[n];
for(int i=0; i<n; i++){
map[i] = new HashMap<>();
}
for(int i=n-2; i>=0; i--){
p[i] += p[i+1];
}
return helper(map,p,0,1);
}
public int helper(Map<Integer,Integer>[] map, int[] p, int i, int m){
if(i+2*m>=p.length) return p[i];
int min = Integer.MAX_VALUE;
for(int x=1; x<=2*m;x++){
int a = Math.max(m,x), b = 0;
if(map[i+x].containsKey(a)){
b = map[i+x].get(a);
}else{
b = helper(map,p,i+x,a);
map[i+x].put(a,b);
}
min = Math.min(min,b);
}
return p[i]-min;
}
python
def stoneGameII(self, A: List[int]) -> int:
N = len(A)
for i in range(N - 2, -1, -1):
A[i] += A[i + 1]
from functools import lru_cache
@lru_cache(None)
def dp(i, m):
if i + 2 * m >= N: return A[i]
return A[i] - min(dp(i + x, max(m, x)) for x in range(1, 2 * m + 1))
return dp(0, 1)