<
出处:http://blog.csdn.net/zhanxinhang>
题目如下:
假设你有一个用1001个整数组成的数组,这些整数是任意排列的,但是你知道所有的整数都在1到1000(包括1000)之间。此外,除一个数字出现两次外,其他所有数字只出现一次。假设你只能对这个数组做一次处理,用一种算法找出重复的那个数字。如果你在运算中使用了辅助的存储方式,那么你能找到不用这种方式的算法吗?
原作者对不用辅助空间的方法进行了描述。但是他用了辅助空间的算法不是最优,于是我给他优化一下:
首先,这是典型的整数型数据判重的问题,有关怎么判重可以阅读我有关海量数据处理里有关整数型的部分。
整数判重首当其冲的就是Bitmap。考虑一下数值范围,1-1000,于是需要1000位,125个字节。
1映射在第一位,1000映射在第1000位。然后你对这些数据进行处理,将相应的位置1,过程中如果有某个位在置位前就已经是1了,那么这个数据就是重复出现的。