问题描述:
给定包含4 300 000 000个32位整数的顺序文件,如何找出一个至少出现两次的整数?
问题解析:
1、假设4 300 000 000个32整数的顺序是随机的。
2、给定的32位整数的个数是4 300 000 000大于2^32-1, 如果其中没有任何一个缺失的32整数,那么重复整数个数就是(4300000000-2^32+1)个。
3、可以通过统计中间值(2^32-1)/2上下的个数来确定重复的数的区间,到这里使用二分搜索去找就顺理成章了。
4、如果有足够的内存,使用位图技术就更方便了!
解决方案:
方案1:
1、使用几个中间文件,按每次中间值的大小作为临界值分割整数,统计每个文件中的应该有的整数个数和实际的整数个数,最终可以确定重复的整数应该在哪个文件中! 对该文件排序,使用二分搜索!
代码暂略!