40. 组合总和 II
这一题跟39题非常类似,但是不同的是,这一题给的集合中有重复的元素。所以关键是要怎么处理这些重复的元素,在保证一个结果中可以出现重复数字的情况下,最后的结果集中又不能有一样的解。
举个例子,比如:nums = [1, 2’, 2’’, 2’’’, 5], target = 5; 那么正确的结果为:
[
[1,2,2],
[5]
]
可以看到,一个正确的解中可以包含重复的数字(2),但结果中没有重复的解,比如[1, 2, 2]和[2, 1, 2]以及[2, 2, 1]。
1. 如何避免重复?——排序
这是这道题目真正难的地方。有关重复的,都需要先对源数组进行排序!!!我开始想到了肯定需要在for循环中增加判断的条件:**nums[i]和nums[i -1]**是否相等( nums[i] == nums[i - 1])。但是仅凭这个条件是不够的。刚开始我写的代码如下:
for (int i = d; i < nums.size(); i++) {
if (i > 0 && nums[i] == nums[i - 1]) { //避免重复
continue;
}
...
这样的输出结果,只有[5],没有了[1, 2, 2]。经过分析,这样写,在求解单个path的时候,会错误的将其舍去。具体的是,当path=[1, 2]时,这个时候会继续调用回溯函数backtrack(), 然后就会来到避免重复的if判断语句,这个时候一判断,i = 2, nums[2] = nums[1] = 2,判断结果为真,那么就会执行continue,而没有把2’‘加入path中,导致了错误。
经过上面的分析,i > 0这个条件肯定不行,但是肯定需要这么一个条件,并且nums[i] == nums[i - 1]的条件肯定也是必须的。因此,前面的条件必须要进行改变,在避免回溯的时候,重复将之前添加过的元素再次添加(添加了2’后,就应该避免将2’‘和2’’'添加到path中)。那么关键就是在同一层中,只选取所有重复的第一个。每一层从哪个开始的呢?是d不是0!!!因此,我们只需将i > 0改为i > d即可!!!!
因此代码如下:
for (int i = d; i < nums.size(); i++) {
if (i > d && nums[i] == nums[i - 1]) { //避免重复的正确写法!!!
continue;
}
...
按照上面的,从索引从哪里开始的就很好理解。之前我写的是d > i,因为我想的是回溯的时候,就是backtrack函数return的时候,这个时候进行判断。此时,因为递归更深了一层,d的值比i大了。所以我之前写的是d > i,但是经过验证,d > i永远不成立。为什么? 因为单看一次backtrack中的一个for循环,就相当于但看一层循环,i的初始值是d,但是在循环过程中i的值不断递增,而d的值没有变!!!至于嵌套的递归,比如backtrack中调用的backtrack’函数,它新开辟了一个自己的变量d’,这个d’和d是不同的变量!所以我之前想的应该是d’比b大,而不是d比d大,此b(实则是d’)非彼b!!!
2. 完整的代码
void backtrack(vector<vector<int>>& res, vector<int>& nums, int target, int d) {
if (target == 0) { //终止条件 且找到了
res.emplace_back(path);
return;
}
for (int i = d; i < nums.size(); i++) {
if (target - nums[i] < 0) { //剪枝操作
break;
}
if (i > d && nums[i] == nums[i - 1]) { //避免重复的关键!
continue;
}
path.push_back(nums[i]);
backtrack(res, nums, target - nums[i], i + 1);//, used);
path.pop_back();
}
}
总结
这题的关键是,怎么避免重复。在这个地方耗了很久,终于是搞明白了。