极小化极大和动态规划之间的故事 2
今天我们继续上次没有讲完的故事。
1 我能赢吗
Leetcode 464:
在 "100 game" 这个游戏中,两名玩家轮流选择从 1 到 10 的任意整数,累计
整数和,先使得累计整数和达到 100 的玩家,即为胜者。
如果我们将游戏规则改为 “玩家不能重复使用整数” 呢?
例如,两个玩家可以轮流从公共整数池中抽取从 1 到 15 的整数(不放回),直
到累计整数和 >= 100。
给定一个整数 maxChoosableInteger (整数池中可选择的最大数)和另一个整数
desiredTotal(累计和),判断先出手的玩家是否能稳赢(假设两位玩家游戏时都表
现最佳)?
你可以假设 maxChoosableInteger 不会大于 20, desiredTotal 不会大于
300。
示例:
输入:
maxChoosableInteger = 10
desiredTotal = 11
输出:
false
解释:
无论第一个玩家选择哪个整数,他都会失败。
第一个玩家可以选择从 1 到 10 的整数。
如果第一个玩家选择 1,那么第二个玩家只能选择从 2 到 10 的整数。
第二个玩家可以通过选择整数 10(那么累积和为 11 >= desiredTotal),从而
取得胜利.
同样地,第一个玩家选择任意其他整数,第二个玩家都会赢。
很显然,这又是一个极小化极大的问题。之前已经提到过,极小化极大往往会重复计算很多次,就比如这道题,先手拿走1后手拿走2,和先手拿走2后手拿走1,是完全等价的。因此,为了避免重复计算,我们需要把“1和2已经被拿走”这个状态以及它的答案(先手能否稳赢)记录下来。 但这就有一个问题,题目条件是整数池的大小 maxChoosableInteger 不大于20,也就是说整个动态规划空间最高会达到20维,这显然是不可接受的。因为这个,之前还犯了一个错误,就是我误以为只需要记录整数池内所有剩下数的和就可以了,如果是这样可行的话,那么动态规划空间就是一维的,但后来发现这是不可行的,因为整数池内还剩下1和2,和还剩下3的状态显然是不能等价的,但是它们的和都是3,因此不能只记录整数池内剩下整数的和。
既然动态空间的维度过高,现在就要想办法对状态进行压缩了。 对于一个数字来说,它只有两种状态:在整数池内,或不在。因此只需要一个比特,而非一个int型,就可以表示一个数的所有状态。而整数池最多有20个数,int型是32位,因此只需要一个int型,就可以表示所有数的所有状态。
对状态进行压缩以后,就可以写代码了。值得注意的是,当整数池内的所有数之和比目标数还要小的时候,两个玩家都无法获胜,这种情况也属于先手无法获胜,因此也要返回false。 这道题实现的代码如下:
class Solution
{
public:
bool canIWin(int maxChoosableInteger, int desiredTotal)
{
int state = 0;
map<int, int> hash;
return minMax(maxChoosableInteger, desiredTotal, state, hash);
}
bool minMax(int maxChoosableInteger, int desiredTotal, int state,
map<int, int>& hash)
{
if (hash[state] == 1) {
return true; }
if (hash[state] == -1) {
return false; }
if (stateToSum(state, maxChoosableInteger) < desiredTotal)