题:假设你有一个用1001个整数组成的数组,这些整数是任意排列的,但是你知道所有的整数都在1到1000(包括1000)之间。此外,除一个数字出现两次外,其他所有数字只出现一次。假设你只能对这个数组做一次处理,用一种算法找出重复的那个数字。如果你在运算中使用了辅助的存储方式,那么你能找到不用这种方式的算法吗?
分析:
方法一、若使用辅助的存储方式,该选择何种存储方式呢?可使用hash的存储方式,以1到1000作为hash表的索引,遍历原数组,统计各数字出现的个数并存储到以该数字为索引值的hash表中,若某个hash[x]的值为2则退出循环,x就是重复出现两次的数字。时间复杂度最坏是O(n)。优点:高效率,缺点:消耗的内存空间过大。代码如下:
- int fun1(const int a[])
- {
- int hash[1002]={0};
- int x=0;
- for(int i = 0; i<1001; i++)
- {
- if((++hash[a[i]]) == 2)
- {
- x = a[i];
- break;
- }
- }
- return x;
- }
方法二、若不使用辅助的存储方式呢?已知1001个整数组成的数组只有一个数字出现了两次,且整数都在1到1000之间,所以可推得数组里面包含了1到1000之间的所有数字为[1,2,3……1000]和一个出现两次的x为1到1000中的任一个数字。这样就可以计算原数组里的所有数字之和S1和等差数列[1,2,3……1000]的和S2,再计算S1与S2之差,该差就是原数组中出现两次的数字x。时间复杂度是固定的O(n)。优缺点:内存空间消耗几乎没有,但是效率要输于使用hash表的存储方式。代码如下:
- int fun2(const int a[])
- {
- int s1=0,s2;
- s2 = 1001*1000/2;
- for(int i = 0; i<1001; i++)
- {
- s1+=a[i];
- }
- return s1-s2;
- }
思路a:求和,最简单也最容易想出来的方法 1+2+3+4+。。。+1000的和与数组的和求差,差的结果就是这个数字,缺点是,求和的话,结果可能会溢出。不妨看思路2
思路b:异或,位操作总有让你惊喜的地方,原理是:
@ 如果两个相同的数求异或,那么结果为0。
@ 0与一个数异或的结果为这个数
@ a^b ^a = b ;a^b^b = a;
据此,可以对数组的元素与1,2,34,56,7,8...1000依次异或,最后的结果就是出现两次的数字。
相应的代码如下:
- #include <stdio.h>
- #include <stdlib.h>
- int findTheNum(int *a){
- int k = a[0];
- for(int i=1;i<=1000;i++){
- k ^= (a[i]^i);
- }
- return k;
- }
- main(){
- int a[1001];
- for(int i = 0;i<=999;i++ ){
- a[i] = i+1;
- }
- a[1000] = rand()%1000;
- printf("the num : %d %d \n",a[1000],findTheNum(a));
- return 0;
- }