主元素(Majority Number)定义为数组中出现次数严格超过一半的数。找到这个数。要求使用O(1)的额外空间和O(n)的时间。
初阶:有N个数,其中一个数的出现次数严格超过了一半。求这个数。
进阶1:有N个数,其中两个数的出现次数都超过了⅓ ,求这两个数。
进阶2:有N个数,其中一个数的出现次数严格超过了⅓,并且没有第二个这样的数。求这个数
进阶3:如果数组中存在且只存在一个出现次数严格超过1/k的数,找到这个数。要求使用O(k)的额外空间和O(n)的时间。
初阶:
采用抵消法。一旦发现数组中存在两个不同的数,就都删除,直到剩下的数都一样。此时剩下的数就是主元素。因为每次抵消操作之 后,剩下来的数种,主元素一定也还是超过一半的。具体实现的时候,记录一个candidate和其出现的次数count,遍历每个数,如果count==0,则把candidate置为遍历到的数,否则看遍历到的数和candidate是否相等,如果相等,则count++,否则count--(抵消),遍历结束后,candidate就是主元素。C++实现如下:
int majorityElement2(vector<int>& nums)
{
int cnt = 1,tmp = nums[0],n = nums.size();
for(int i=1;i<n;i++){
if(0 == cnt)
tmp = nums[i];
if(nums[i]==tmp)
cnt++;
else cnt--;
}
return tmp;
}
当然该问题没有严格是时空限制,也可直接C++STL实现。想一下可以发现,如果一个数字存在一个数出现的概率严格大于1/2,那个如果对数组进行排序,中间的那个数肯定就是这个要找的数。
int majorityElement(vector<int>& nums)
{
sort(nums.begin(),nums.end());
int n=nums.size();
return nums[n/2];
}
进阶1:仍然是抵消法。如果三个数不一样,就三个数都扔掉。因此记录2个数,及其各自出现次数即可。直接上代码:
vector<int> majorityElement(vector<int>& nums)
{
vector<int>res;
int n = nums.size();
if(n<1)return res;
int cnt1=0,cnt2=0,tmp1=nums[0],tmp2=nums[0];
for (int i = 0; i < n; i++) {
if (nums[i] == tmp1)
cnt1++;
else if (nums[i] == tmp2)
cnt2++;
else if (cnt1 == 0) {
tmp1 = nums[i];
cnt1 = 1;
} else if (cnt2 == 0) {
tmp2 = nums[i];
cnt2 = 1;
} else {
cnt1--;
cnt2--;
}
}
int count1=0,count2=0,tmp=0;
for(int i=0;i<n;i++){
if(nums[i]==tmp1)
count1++;
else if(nums[i]==tmp2)
count2++;
}
if(count1>n/3)
res.push_back(tmp1);
if(count2>n/3)
res.push_back(tmp2);
return res;
}
进阶2:该问题其实是进阶1的简化版,可直接通过修改进阶1代码实现
int majorityElement(vector<int>& nums)
{
int n = nums.size();
int cnt1=0,cnt2=0,tmp1=nums[0],tmp2=nums[0];
for (int i = 0; i < n; i++) {
if (nums[i] == tmp1)
cnt1++;
else if (nums[i] == tmp2)
cnt2++;
else if (cnt1 == 0) {
tmp1 = nums[i];
cnt1 = 1;
} else if (cnt2 == 0) {
tmp2 = nums[i];
cnt2 = 1;
} else {
cnt1--;
cnt2--;
}
}
int count1=0,count2=0,tmp=0;
for(int i=0;i<n;i++){
if(nums[i]==tmp1)
count1++;
else if(nums[i]==tmp2)
count2++;
}
if(count1>count2)return tmp1;
else return tmp2;
}
进阶3:一个方法是按照前面的进行推广,如果出现k个不一样的数,就抵消掉。假设k=4,实现如下
int majorityElement4(vector<int>& nums)
{
int n = nums.size();
int cnt1=1,cnt2=1,cnt3=1;
int tmp1=nums[0],tmp2=nums[0],tmp3=nums[0];
for (int i = 1; i < n; i++) {
if (nums[i] == tmp1)
cnt1++;
else if (nums[i] == tmp2)
cnt2++;
else if(nums[i]==tmp3)
cnt3++;
else if (cnt1 == 0) {
tmp1 = nums[i];
cnt1 = 1;
} else if (cnt2 == 0) {
tmp2 = nums[i];
cnt2 = 1;
}else if (cnt2 == 0) {
tmp2 = nums[i];
cnt2 = 1;
}else {
cnt1--;
cnt2--;
cnt3--;
}
}
int count1=0,count2=0,count3=0;
for(int i=0;i<n;i++){
if(nums[i]==tmp1)
count1++;
else if(nums[i]==tmp2)
count2++;
else if(nums[i]==tmp3)
count3++;
}
int c = max(count1,max(count2,count3));
map<int, int> mymap;
mymap.insert(pair<int, int>(count1, tmp1));
mymap.insert(pair<int, int>(count2, tmp2));
mymap.insert(pair<int, int>(count3, tmp3));
map<int, int>::iterator iter = mymap.find(c);
return iter->second;
}
进阶3:另一个思路是,如果出现k个不一样的数,就抵消掉。这里需要用巧妙的数据结构来记录Candidates,并使得如下操作均为O(1):
1. 加入一个Candidate/给某个Candidate出现次数+1
2. Candidates中是否存在某个数
3. Candidates中所有数的出现次数 - 1
4. 移除出现次数为0的Candidates
对于1,2两个操作,我们自然可以想到使用Hash表来完成。对于第4两个操作,我们希望能够有出现次数最少的Candidate的信息,但是如果使用Heap则并非O(1)的时间复杂度。注意到每一次加入一个Candidate时,count均为1,每一次给改变一个Candidate出现次数时,也只涉及到加1运算。因此,如果我们能维护Candidates的有序性,就可以容易的解决这个问题。方法是,使用LinkedList。与普通的LinkedList不同的是,我们将所有出现次数相同的Candidate放在一个Bucket里,Bucket内部的Candidate用Doubly Linked List链接起来,Bucket之间也用Doubly Linked List链接起来。这样针对+1运算,我们只需要通过Hash表找到对应的Candidate,把Candidate从当前的Bucket移动到下一个Bucket(出现次数+1的Bucket)。另外,对于所有数-1的操作,我们记录全局的一个Base,每次-1操作,则Base+1。如果Base和Buckets中的第一个Bucket中的Candidates的出现次数相同,则整个删除第一个Bucket。最后,我们会得到最大k-1个Candidates,重新遍历一遍整个数组,用O(k)的Hash记录这k-1个Candidates的出现次数,就可以验证谁是真正的主元素。
**************************C++实现下次更新*************************
完整的测试代码:
#include<iostream>
#include<vector>
#include<map>
using namespace std;
vector<int> majorityElement(vector<int>& nums)
{
vector<int>res;
int n = nums.size();
if(n<1)return res;
int cnt1=1,cnt2=1,tmp1=nums[0],tmp2=nums[0];
for (int i = 1; i < n; i++) {
if (nums[i] == tmp1)
cnt1++;
else if (nums[i] == tmp2)
cnt2++;
else if (cnt1 == 0) {
tmp1 = nums[i];
cnt1 = 1;
} else if (cnt2 == 0) {
tmp2 = nums[i];
cnt2 = 1;
} else {
cnt1--;
cnt2--;
}
}
int count1=0,count2=0,tmp=0;
for(int i=0;i<n;i++){
if(nums[i]==tmp1)
count1++;
else if(nums[i]==tmp2)
count2++;
}
if(count1>n/3)
res.push_back(tmp1);
if(count2>n/3)
res.push_back(tmp2);
return res;
}
int majorityElement2(vector<int>& nums)
{
int cnt = 1,tmp = nums[0],n = nums.size();
for(int i=1;i<n;i++){
if(0 == cnt)
tmp = nums[i];
if(nums[i]==tmp)
cnt++;
else cnt--;
}
return tmp;
}
int majorityElement3(vector<int>& nums)
{
int n = nums.size();
int cnt1=1,cnt2=1,tmp1=nums[0],tmp2=nums[0];
for (int i = 1; i < n; i++) {
if (nums[i] == tmp1)
cnt1++;
else if (nums[i] == tmp2)
cnt2++;
else if (cnt1 == 0) {
tmp1 = nums[i];
cnt1 = 1;
} else if (cnt2 == 0) {
tmp2 = nums[i];
cnt2 = 1;
} else {
cnt1--;
cnt2--;
}
}
int count1=0,count2=0,tmp=0;
for(int i=0;i<n;i++){
if(nums[i]==tmp1)
count1++;
else if(nums[i]==tmp2)
count2++;
}
if(count1>count2)
return tmp1;
else return tmp2;
}
int majorityElement4(vector<int>& nums)
{
int n = nums.size();
int cnt1=1,cnt2=1,cnt3=1;
int tmp1=nums[0],tmp2=nums[0],tmp3=nums[0];
for (int i = 1; i < n; i++) {
if (nums[i] == tmp1)
cnt1++;
else if (nums[i] == tmp2)
cnt2++;
else if(nums[i]==tmp3)
cnt3++;
else if (cnt1 == 0) {
tmp1 = nums[i];
cnt1 = 1;
} else if (cnt2 == 0) {
tmp2 = nums[i];
cnt2 = 1;
}else if (cnt2 == 0) {
tmp2 = nums[i];
cnt2 = 1;
}else {
cnt1--;
cnt2--;
cnt3--;
}
}
int count1=0,count2=0,count3=0;
for(int i=0;i<n;i++){
if(nums[i]==tmp1)
count1++;
else if(nums[i]==tmp2)
count2++;
else if(nums[i]==tmp3)
count3++;
}
int c = max(count1,max(count2,count3));
map<int, int> mymap;
mymap.insert(pair<int, int>(count1, tmp1));
mymap.insert(pair<int, int>(count2, tmp2));
mymap.insert(pair<int, int>(count3, tmp3));
map<int, int>::iterator iter = mymap.find(c);
return iter->second;
}
int main()
{
int arr2[]={2,3,2,5,2,1,2};
int arr3[]={1,4,3,3};
int arr[]={1,2,3,2,5,2,1,2,1,1};
vector<int>vec2(arr2,arr2+7);
vector<int>vec3(arr3,arr3+4);
vector<int>vec(arr,arr+10);
vector<int>result;
int a,b,c;
a = majorityElement2(vec2);
b = majorityElement3(vec3);
c = majorityElement4(vec3);
result = majorityElement(vec);
cout<<"出现1/2次以上的数:"<<a<<endl;
cout<<"出现1/3次以上的数:"<<b<<endl;
cout<<"出现1/4次以上的数:"<<c<<endl;
cout<<"所有出现概率1/3以上的数:";
for(vector<int>::iterator iter=result.begin();iter !=result.end();++iter)
cout<<*iter<<" ";
cout<<endl;
return 0;
}
参考 http://www.jiuzhang.com/problem/37/