问题描述(难度 *):
传说,Tango有一大“水王”,他不但喜欢发贴,还会回复其他ID发的每个帖子。坊间风闻该“水王”发帖数目超过了帖子总数的一半。如果你有一个当前论坛上所有帖子(包括回帖)的列表,其中帖子作者的ID也在表中,你能快速找出这个传说中的Tango水王吗?
方法1:
先对ID列表进行排序,由于“水王ID”出现次数超过总次数的一半,则有序ID列表的第N/2项(从0开始编号)一定是“水王”的ID。算法复杂度为排序的复杂度O(N*log2N)。
方法2:
避免排序。每次去掉两个不同的ID,不断缩小问题规模,而又可以保证水王的ID保持占总数的1/2以上,时间复杂度仅为O(N)。代码的写法也有技巧,并不是真正删除列表中的ID,而是使用一个计数器nTimes和一个Candidate记录ID来实现。在遍历一次列表的过程中,如果遇到和candidate相同的元素,则nTimes+1;如果遇到和candiate不同的元素,则计数器-1;如果计数器的值=0,则把下一个a[i]赋给candidate,相当于把之前的所有元素都删除了,这些元素是两两不同的;最后留下的candidate的值就是水王的ID。书中附的伪代码如下:
1 Type Find(Type* ID, int N) 2 { 3 Type candidate; 4 int nTimes, i; 5 for(i = nTimes = 0; i < N; i++) 6 { 7 if(nTimes == 0) 8 { 9 candidate = ID[i], nTimes = 1; 10 } 11 else 12 { 13 if(candidate == ID[i]) 14 nTimes++; 15 else 16 nTimes--; 17 } 18 19 } 20 return candidate; 21 }
扩展问题:
随着Tango的发展,管理员发现,“超级水王”没有了。统计结果表明,有3个发帖很多的ID,他们的发帖数目都超过了帖子总数目N的1/4。你能从发帖ID列表中快速找出他们的ID吗?
同样采取方法2的思想,实现代码(C++)如下:
1 #include <iostream> 2 using namespace std; 3 4 /* 5 6 扩展问题:假如有3个发帖很多的ID,他们的发帖总数都超过看1/4,快速找出他们的ID。 7 8 思路:分别用三个计数器(T1,T2,T3)记录3个Candidate(C1,C2,C3),如果出现相同元素,则对应的计数器+1,如果元素与三个Candidate都不相同,则三个计数器均-1; 9 当计数器为0时,则将i++后的a[i]值赋给相应的Candidate,这样就相当于去掉了4(或4的整数倍)个不同的ID,使问题规模缩小,而3个Candidate所占的比例仍然超过1/4, 10 遍历一遍后则可得到所求的3个ID。 11 12 */ 13 14 int main(int argc, char const *argv[]) 15 { 16 int T1,T2,T3; //设置3个计时器 17 int C1,C2,C3; //3个candidate 18 int i; 19 int const N = 20; //总帖子数 20 21 T1 = 0,T2 = 0,T3 = 0; 22 int a[N] = {1,1,4,3,1,1,2,2,3,3,4,1,2,1,2,3,3,3,2,2}; 23 24 for(i = 0; i < N; i++) 25 { 26 27 if(T1 == 0 || C1 == a[i]) //计时器=0时,C1 = a[i],计数器+1;或者计数器不为0,C1 == a[i]时,前一句相当于没有改变,计数器+1 28 { 29 C1 = a[i]; 30 T1++; 31 } 32 else if(T2 == 0 || C2 == a[i]) 33 { 34 C2 = a[i]; 35 T2++; 36 } 37 else if(T3 == 0 || C3 == a[i]) 38 { 39 C3 = a[i]; 40 T3++; 41 } 42 else //如果与三个candidate都不相同,三个计数器均-1 43 { 44 T1--; 45 T2--; 46 T3--; 47 } 48 } 49 50 cout<<"C1 :"<<C1<<endl; 51 cout<<"C2 :"<<C2<<endl; 52 cout<<"C3 :"<<C3<<endl; 53 54 55 return 0; 56 }