原题意思很简单,求一个可能包含重复元素的集合的所有子集。
先从简单着手,假设是简单集合,不包含重复元素。
将集合B的元素编号为a1,a2,...,an,那么B的所有的子集构成的集合S(n)=S(n-1)+{ an+ A,for every set A in S(n-1)};
n=0,S(0) = { [ ]};
n= 1,S(1) = { [ ] ,{a1} };
...
当存在重复元素时,首先给集合元素排序,使得相同的元素相邻。
首先将前i个元素组成的所有子集的集合S(i)分为两部分:
C(i):前i个元素的所有子集中包含第i个元素a(i);
D(i):前i个元素的所有子集中不包含第i个元素a(i);
显然有:C(i) = { D(i)+a(i) };
那么由S(i+1)=S(i)+{ a(i+1)+ A,for every set A in S(i)}计算可得:
S(i+1) = C(i) + D(i) + {C(i)+a(i+1)} + {D(i)+a(i+1)}
当a(i+1) = a(i)时,{ D(i) + a(i+1) } = {D(i) + a(i) } = C(i),有重复;
所以上式计算得到的S(i+1) 应该去掉最后一项 ,也即此时:
S(i+1) = C(i) + D(i) + {C(i) + a(i+1) };
而进一步考虑C(i)的来源,由定义可以看出,C(i)实际上是递推式S(i) 的第二部分{ a(i)+ A,for every set A in S(i-1)}。也就是说,在递推的情况下,在第i+1步,前一步(i)的第二项(即C(i))实际上是已知。
代码如下:
vector<vector<int>> subsetsWithDup(vector<int>& nums) {
vector<int> tmp;
vector<vector<int>> ret;
ret.push_back(tmp);
sort(nums.begin(),nums.end()); //排序,使得相同的元素相邻
int t = 0; //上一次递推中第二部分在ret中的起始标号
for(int i=0;i<nums.size();++i)
{
int z =0;
if(!(i==0||nums[i-1]!=nums[i]))//如果重复
{
z = t;
}
int len = ret.size(); //以下添加到ret集合中的子集均是包含ai的,也即C(i),在ret集合中起始标号就是len了。
for(int j =z;j<len;++j)
{
vector<int> tmp = ret[j];
tmp.push_back(nums[i]);
ret.push_back(tmp);
}
t= len;
}
return ret;
}