问题描述:
Tango 是微软亚洲研究院的一个实验项目,研究院的员工和实习生们都很喜欢在Tango上面交流灌水。传说,Tango有一大“水王”,他不但喜欢发帖,还会回复其他ID发的每个帖子。坊间风闻该“水王”发帖数目超过了帖子总数的一半。如果你有一个当前论坛上所有帖子(包括回帖)的列表,其中帖子作者的ID也在表中,你能快速找出这个传说中的Tango水王吗?
分析:
如果对ID列表排序然后再寻找,存在排序的时间复杂度,如何避免排序呢?
如果每次删除两个不同的ID(不管是否包含”水王“的ID),那么,在剩下的ID列表中,”水王“ID出现的次数仍然超过总数的一半。可以通过不断重复这个过程,把ID列表的ID总数降低(转化为更小的问题),从而得到答案。新的思路,避免了排序这个耗时的步骤,总的时间复杂度只有O(N),且只需要常数的额外内存。
伪代码如下:
Type Find(Type* ID,int N)
{
Type candidate;
int nTimes,i;
for(i = nTimes = 0;i < N;i++)
{
if(nTimes == 0)
{
candidate = ID[i],nTimes = 1;
}
else
{
if(candidate == ID[i])
nTimes++;
else
nTimes--;
}
}
return candidate;