题目地址:
https://leetcode.com/problems/subsets-ii/
给定一个长 n n n数组 A A A,可能含重复数字。求其所有组合,重复的组合只保留一次。
法1:DFS + 去重。由于原数组中有重复,所以求子集的时候需要注意到不要把完全相等的子集加多遍。我们设置的标准是,考虑重复元素的时候,只允许从重复元素的第一个数开始枚举,并且每次枚举必须枚举连续位置上的数。例如考虑 ( 1 , 1 ′ , 1 ′ ′ , 2 ) (1,1',1'',2) (1,1′,1′′,2)的子集,我们只允许枚举形如 ( 1 , 2 ) (1,2) (1,2), ( 1 , 1 ′ , 2 ) (1,1',2) (1,1′,2), ( 1 , 1 ′ , 1 ′ ′ , 2 ) (1,1',1'',2) (1,1′,1′′,2)这样的子集,即第一个 1 1 1必须出现在之后的 1 1 1之前,而不允许反序;并且,每个包含 1 1 1的子集必须包含首个的 1 1 1。具体可以由以下代码实现:
if (i > u && a[i] == a[i - 1]) continue;
首先,如果某一层枚举到了重复数字中的第一个数,那么本层继续枚举之后的数的时候,会发现当前的数和之前那个位置的数相等,从而直接略过了,所以每个子集,如果它包含这个数,那么只会包含重复数字中的第一个数开始的组合;其次,如果某位重复的数被枚举过了,那么在它递归的下一层的循环里,只有这个数的紧邻的下一个数会被枚举,其余的数由于和前一个数相同,就会略过去。所以这段代码可以实现那个功能。
代码如下:
class Solution {
public:
vector<vector<int>> subsetsWithDup(vector<int>& a) {
sort(a.begin(), a.end());
vector<vector<int>> res;
vector<int> v;
dfs(0, v, a, res);
return res;
}
void dfs(int u, vector<int>& v, vector<int>& a, vector<vector<int>>& res) {
res.push_back(v);
for (int i = u; i < a.size(); i++) {
if (i > u && a[i] == a[i - 1]) continue;
v.push_back(a[i]);
dfs(i + 1, v, a, res);
v.pop_back();
}
}
};
时间复杂度 O ( n 2 n ) O(n2^n) O(n2n),空间 O ( n ) O(n) O(n)。
法2:DFS + 枚举某个数字取多少次。先排序。枚举的时候先数一下当前数字在数组中有多少个,然后枚举其选 0 , 1 , 2 , . . . 0,1,2,... 0,1,2,...次即可。代码如下:
class Solution {
public:
vector<vector<int>> subsetsWithDup(vector<int>& a) {
sort(a.begin(), a.end());
vector<vector<int>> res;
vector<int> v;
dfs(0, v, a, res);
return res;
}
void dfs(int u, vector<int>& v, vector<int>& a, vector<vector<int>>& res) {
if (u == a.size()) {
res.push_back(v);
return;
}
// 求a[u]总共有多少个
int cnt = 0;
while (u + cnt < a.size() && a[u + cnt] == a[u]) cnt++;
// 枚举要加多少个a[u]进子集
for (int i = 0; i <= cnt; i++) {
dfs(u + cnt, v, a, res);
v.push_back(a[u]);
}
// 恢复现场
v.resize(v.size() - cnt - 1);
}
};
时空复杂度一样。