题目:Tango是微软亚洲研究院的一个试验项目。研究院的员工和实习生们都很喜欢在Tango上面交流灌水。传说,Tango有一大“水王”,他不但喜欢发贴,还会回复其他ID发的每个帖子。坊间风闻该“水王”发帖数目超过了帖子总数的一半。如果你有一个当前论坛上所有帖子(包括回帖)的列表,其中帖子作者的ID也在表中,你能快速找出这个传说中的Tango水王吗? –《编程之美》
扩展:随着Tango的发展,管理员发现,“超级水王”没有了。统计结果表明,有3个发帖很多的ID,他们的发帖数目都超过了帖子总数目N的1/4。你能从发帖ID列表中快速找出他们的ID吗?
分析:在这个题目中,有一个计算机科学中很普遍的思想,就是如何把一个问题转化为规模较小的若干个问题。分治、递推和贪心等都有这样的思想。在转化过程中,如果能保证小的问题跟原问题的解是一致的就成功了。这样,我们可以通过寻找这样的方式将小问题转化为更小的问题。如何将大问题拆成小问题,或者如何大规模的数据降成小规模,而不影响解呢?
如果每次删除两个不同的ID,不管删除的ID是否包含“水王”的ID,在剩下的ID列表中,“水王”ID出现的次数仍然超过总数的一半。想到这一点之后,上述分析的思想已经构筑完成,就可以通过不断重复这个过程,把ID列表中的ID总数降低(转化为更小的问题),从而得到问题的答案。新的思路,避免了排序这个耗时的步骤,总的时间复杂度只有O(N),且只需要常数的额外内存。
代码如下:
#include <stdio.h>
typedef int Type;
Type find (Type *a, int N)
{
Type candiate;
int i, nTimes;
for (i = nTimes = 0; i < N; i++)
{
if (0 == nTimes)
{
candiate = a[i];
nTimes = 1;
}
else
{
if (candiate == a[i])
{
nTimes++;
}
else
{
nTimes--;
}
}
}
return candiate;
}
int main()
{
Type arr[] = {1, 2, 3, 4, 2, 5, 2, 2, 3, 2, 5, 2};
printf("over harf id is %d\n", find(arr, 12));
return 0;
}
解扩展题:
求解内容极其相似,相同的思路进行求解即可。同时删除4个不同的ID后,剩余数据中3个多数id仍然是多数ID。
上题只需要一个结果,而现在需要3个结果,上题用到的nTimes,也应改为3个计数器。现在我们需要3个变量来记录当前遍历过的3个不同的ID,而nTimes的3个元素分别对应当前遍历过的3个ID出现的个数。如果遍历中有某个ID不同于这3个当前ID,我们就判断当前3个ID是否有某个的nTimes为0,如果有,那这个新遍历的ID就取而代之,并赋1为它的遍历数(即nTimes减1),如果当前3个ID的nTimes皆不为0,则3个ID的nTimes皆减去1。
测试代码如下:
#include<iostream>
using namespace std;
void Find(int *ID,int N,int candidate[3])
{
int ID_NULL;
int nTimes[3],i;
nTimes[0]=nTimes[1]=nTimes[2]=0;
candidate[0]=candidate[1]=candidate[2]=ID_NULL;
for(i=0;i<N;i++)
{
if(ID[i]==candidate[0])
{
nTimes[0]++;
}
else if(ID[i]==candidate[1])
{
nTimes[1]++;
}
else if(ID[i]==candidate[2])
{
nTimes[2]++;
}
else if(nTimes[0]==0)
{
nTimes[0]=1;
candidate[0]=ID[i];
}
else if(nTimes[1]==0)
{
nTimes[1]=1;
candidate[1]=ID[i];
}
else if(nTimes[2]==0)
{
nTimes[2]=1;
candidate[2]=ID[i];
}
else
{
nTimes[0]--;
nTimes[1]--;
nTimes[2]--;
}
}
cout<<candidate[0]<<" "<<candidate[1]<<" "<<candidate[2]<<endl;
return;
}
int main()
{
int arr[]={1,1,2,2,3,4,5,5};
int candidate[3];
Find(arr,8,candidate);
}