1 书中的算法分析
在微软亚洲研究院上班,大家早上来的第一件事是干啥呢?查看邮件?No,是去水房拿饮料:酸奶,豆浆,绿茶、王老吉、咖啡、可口可乐……(当然,还是有很多同事把拿饮料当做第二件事)。
管理水房的阿姨们每天都会准备很多的饮料给大家,为了提高服务质量,她们会统计大家对每种饮料的满意度。一段时间后,阿姨们已经有了大批的数据。某天早上,当实习生小飞第一个冲进水房并一次拿了五瓶酸奶、四瓶王老吉、三瓶鲜橙多时,阿姨们逮住了他,要他帮忙。
从阿姨们统计的数据中,小飞可以知道大家对每一种饮料的满意度。阿姨们还告诉小飞,STC(Smart Tea Corp.)负责给研究院供应饮料,每天总量为V。STC很神奇,他们提供的每种饮料之单个容量都是2的方幂,比如王老吉,都是23=8升的,可乐都是25=32升的。当然STC的存货也是有限的,这会是每种饮料购买量的上限。统计数据中用饮料名字、容量、数量、满意度描述每一种饮料。
那么,小飞如何完成这个任务,求出保证最大满意度的购买量呢?
分析与解法
【解法一】
我们先把这个问题“数学化”一下吧。
假设STC共提供n种饮料,用(Si、Vi、Ci、Hi、Bi)(对应的是饮料名字、容量、可能的最大数量、满意度、实际购买量)来表示第i种饮料(i = 0, 1,…, n-1),其中可能的最大数量指如果仅买某种饮料的最大可能数量,比如对于第i中饮料Ci=V/Vi。
基于如上公式:
饮料总容量为;
总满意度为;
那么题目的要求就是,在满足条件的基础上,求解。
对于求最优化的问题,我们来看看动态规划能否解决。用Opt(V', i)表示从第i, i+1, i+2, …, n-1种饮料中,算出总量为V'的方案中满意度之和的最大值。
因此,Opt(V, 0)就是我们要求的值。
那么,我们可以列出如下的推导公式:Opt (V', i) = max { k* Hi + Opt(V' - Vi * k, i+1)}(k = 0, 1, …, Ci,i =0, 1, …, n-1)。
即:最优化的结果 = 选择第k种饮料×满意度+减去第k种饮料×容量的最优化结果根据这样的推导公式,我们列出如下的初始边界条件:
Opt(0, n)= 0,即容量为0的情况下,最优化结果为0。
Opt(x, n)= -INF(x != 0)(–INF为负无穷大),即在容量不为0的情况下,把最优化结果设为负无穷大,并把它作为初值。
那么,根据以上的推导公式,就不难列出动态规划求解代码,如下所示:
代码清单1-9
int Cal(intV, int type)
{
opt[0][T] = 0;// 边界条件
for(int i = 1; i <=V; i++)// 边界条件
{
opt[i][T] = -INF;
}
for(int j = T - 1; j>= 0; j--)
{
for(int i = 1; i <= V; i++)
{
opt[i][j] = -INF;
for(int k = 0; k <= C[j];k++) // 遍历第j种饮料选取数量k
{
if(i < k * V[j])
{
break;
}
int x = opt[i - k * V[j]][j + 1];
if(x != -INF)
{
x += H[j] * k;
if(x > opt[i][j])
{
opt[i][j] = x;
}
}
}
}
}
return opt[V][0];
}
在上面的算法中,空间复杂度为O(V*N),时间复杂度约为O(V*N*Max(Ci))。
因为我们只需要得到最大的满意度,则计算opt[i][j]的时候不需要opt[i][j+2],只需要opt[k][j+1](0<=k<=V),所以空间复杂度可以降为O(v)。
【解法二】
应用上面的 动态规划法可以得到结果,那么是否有可能进一步地提高效率呢?我们知道动态规划算法的一个变形是备忘录法,备忘录法也是用一个表格来保存已解决的子问题的 答案,并通过记忆化搜索来避免计算一些不可能到达的状态。具体的实现方法是为每个子问题建立一个记录项。初始化时,该纪录项存入一个特殊的值,表示该子问 题尚未求解。在求解的过程中,对每个待求解的子问题,首先查看其相应的纪录项。若记录项中存储的是初始化时存入的特殊值,则表示该子问题是第一次遇到,此 时计算出该子问题的解,并保存在其相应的记录项中。若记录项中存储的已不是初始化时存入的初始值,则表示该子问题已经被计算过,其相应的记录项中存储的是 该子问题的解答。此时只需要从记录项中取出该子问题的解答即可。
因此,我们可以应用备忘录法来进一步提高算法的效率。
代码清单1-10
int opt[V + 1][T + 1]; // 子问题的记录项表,假设从i到T种饮料中,
// 找出容量总和为V’的一个方案,快乐指数最多能够达到
// opt(V',i,T-1),存储于opt[V’][i],
// 初始化时opt中存储值为-1,表示该子问题尚未求解。
int Cal(intV, int type)
{
if(type == T)
{
if(V== 0)
return 0;
else
return -INF;
}
if(V < 0)
return -INF;
else if(V == 0)
return 0;
else if(opt[V][type] !=-1)
return opt[V][type]; // 该子问题已求解,则直接返回子问题的解;
// 子问题尚未求解,则求解该子问题
int ret = -INF;
for(int i = 0; i <=C[type]; i++)
{
int temp = Cal(V– i * C[type], type + 1);
if(temp != -INF)
{
temp += H[type] * i;
if(temp > ret)
ret = temp;
}
}
return opt[V][type] =ret;
}
【解法三】
请注意这个题目的限制条件,看看它能否给我们一些特殊的提示。
我们把信息重新整理一下,按饮料的容量(单位为L)排序:
Volume | TotalCount | Happiness |
20 | TC0_0 | H0_0 |
… | … | … |
20 | TC0_n0 | H0_n0 |
… | … | … |
21 | TC1_0 | H1_0 |
… | … | … |
2M | TCM_0 | HM_0 |
… | … | … |
假设最大容量为2 000L。一开始,如果V%(21)非零,那么,我们肯定需要购买20L容量的饮料,至少一瓶。在这里可以使用贪心规则,购买快乐指数最高的一瓶。除去这个,我们只要再购买总量(V-20) L的饮料就可以了。这时,如果我们要购买21L容量的饮料怎么办呢?除了21L容量里面快乐指数最高的,我们还应该考虑,两个容量为20L的饮料组合的情 况。其实我们可以把剩下的容量为20L的饮料之快乐指数从大到小排列,并用最大的两个快乐指数组合出一个新的“容量为2L”的饮料。不断地这样使用贪心原 则,即得解。这是不是就简单了很多呢?
2 算法分析
2.1 动态规划算法
没有悬念,优化问题就用动态规划、贪心算法、分支限界轮番上阵就好了。设Opt(V’,i)表示从i到n-1种饮料中,Ci为第i种饮料可能的最大数量,算出总量为V’的方案中满意度之和的最大值。那么递归式就应该是:
Opt(V’,i)=max{ k * Hi+Opt(V’-Vi * k,i+1)}(k=0,1,2…,Ci,i=0,1,2…,n-1)
这里我觉得需要说明给出的饮料组合最终可以组合出V。
2.2 贪心算法
书中的贪心解法似曾相识,把信息按照饮料的容量排序(其中设我们有n0种容量为20的饮料):
Volume | TotalCount | Happiness |
20 | TC0_0 | H0_0 |
… | … | … |
20 | TC0_n0 | H0_n0 |
… | … | … |
21 | TC1_0 | H1_0 |
… | … | … |
2M | TCM_0 | HM_0 |
… | … | … |
然后按照下面的顺序进行贪心选择:
(1) 饮料总量为1,从容量为20的饮料中选出快乐指数最大的。
(2) 饮料总量为2,从容量为21的饮料中选出快乐指数最大的(设为H1),与容量为20的饮料中快乐指数最大的(设为H0),比较H1和2* H0,取出其中最大者为当前最佳选择
(3) 继续进行下去,直到求出Opt(V,0)
粗看一下,有些似曾相识。我们在买书问题的时候也曾面临将买书计划拆分,然后查表进行贪心选择。然而买书问题每次选择至多选M本书,而且每次选择只影响下一次选择,所以只需要把2M进行有限的拆分即可。
而本题则不尽相同,对于某种容量V’(以V’=11为例)来说,有两个问题:
1. 首先,我们需要察看所有拆分的可能性,找出其中最大者作为本次贪心选择的结果。其中,由于“每种饮料的单位容量都是2的方幂”,所以拆分结果仅考虑用小于V’的2的方幂来进行组合,即(计算式1)11=8+2+1,4+4+2+1,4+2+2+2+1,….,1+1+…+1。可以看到,对于V’我们至少可以“拆”出V’种组合(或许更多),即便我们把每次的计算结果用表格保存起来,我们的查找次数也至少是Ω(1+2+…+V’=V’2),空间复杂度也很高,并没有如数中说“简单很多”。而且,如果取消“每种饮料的单位容量都是2的方幂”的限制,拆分的结果就会变成(计算式2)11=10+1,9+2,…,5+5,5+5+1,5+4+2,…..,导致查找次数进一步增加。
2. 其次,让我们回到贪心选择的定义上来。由于贪心选择性,贪心算法的过程是每次选择都选取当前看来最好的结果,使得当达到最终状态时的结果刚好是最优解。而我们再看V’=11的例子,假设最优解是4+4+2+1,则我们曾经计算过的8就不是最优解的一部分,这就和贪心算法的精神不符,所以这个方法其实还是动态规划。
3 总结
动态规划解法很好,贪心算法有待商榷。其实这是正常的,因为通常情况下使用贪心算法的难点在于证明贪心选择性的存在,鉴于这本书的定位,我们不能苛责更多。但是这个问题和上一个问题(买书折扣问题)的贪心算法我觉得都过于草率。如果想让这本书成为经典,“微软面试”的噱头是远远不够的,精益求精的态度至关重要,有时候真的没必要把Deadline设置的那么紧迫,偶尔跳票追求质量也是理所应当,看看人家暴雪的“星际争霸2”跳票这么多年就知道了…….