【白话经典算法系列之十】 一道有趣的GOOGLE面试题

最近在微博上看到一道有趣的GOOGLE面试题,见下图:

文字版:

一个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,找到至少一个重复元素,要求O(1)空间和O(n)时间。

 

    这个题目要求用O(n)的时间复杂度,这意味着只能遍历数组一次。同时还要寻找重复元素,很容易想到建立哈希表来完成,遍历数组时将每个元素映射到哈希表中,如果哈希表中已经存在这个元素则说明这就是个重复元素。因此直接使用C++ STL中的hash_set(参见《STL系列之六 sethash_set》)可以方便的在O(n)时间内完成对重复元素的查找。

    但是题目却在空间复杂度上有限制——要求为O(1)的空间。因此采用哈希表这种解法肯定在空间复杂度上是不符合要求的。但可以沿着哈希法的思路继续思考,题目中数组中所以数字都在范围[0 n-1],因此哈希表的大小为n即可。因此我们实际要做的就是对n个范围为0n-1的数进行哈希,而哈希表的大小刚好为n。对排序算法比较熟悉的同学不难发现这与一种经典的排序算法——基数排序非常类似。而基数排序的时间空间复杂度刚好符合题目要求!因此尝试使用基数排序来解这道面试题。

 

    下面以2415761902这十个数为例,展示下如何用基数排序来查找重复元素。

下标

  0

  1

  2

  3

  4

  5

  6

  7

  8

  9

数据

  2

  4

  1

  5

  7

  6

  1

  9

  0

  2

1)由于第0个元素a[0] 等于2不为0,故交换a[0]a[a[0]]即交换a[0]a[2]得:

下标

  0

  1

  2

  3

  4

  5

  6

  7

  8

  9

数据

  1

  4

  2

  5

  7

  6

  1

  9

  0

  2

2)由于第0个元素a[0] 等于1不为0,故交换a[0]a[a[0]]即交换a[0]a[1]得:

下标

  0

  1

  2

  3

  4

  5

  6

  7

  8

  9

数据

  4

  1

  2

  5

  7

  6

  1

  9

  0

  2

3)由于第0个元素a[0] 等于4不为0,故交换a[0]a[a[0]]即交换a[0]a[4]得:

下标

  0

  1

  2

  3

  4

  5

  6

  7

  8

  9

数据

  7

  1

  2

  5

  4

  6

  1

  9

  0

  2

4)由于第0个元素a[0] 等于7不为0,故交换a[0]a[a[0]]即交换a[0]a[7]得:

下标

  0

  1

  2

  3

  4

  5

  6

  7

  8

  9

数据

  9

  1

  2

  5

  4

  6

  1

  7

  0

  2

5)由于第0个元素a[0] 等于9不为0,故交换a[0]a[a[0]]即交换a[0]a[9]得:

下标

  0

  1

  2

  3

  4

  5

  6

  7

  8

  9

数据

  2

  1

  2

  5

  4

  6

  1

  7

  0

  9

6)由于第0个元素a[0] 等于2不为0,故交换a[0]a[a[0]]即交换a[0]a[2],但a[2]也为2a[0]相等,因此我们就找到了一个重复的元素——2

下标

  0

  1

  2

  3

  4

  5

  6

  7

  8

  9

数据

  2

  1

  2

  5

  4

  6

  1

  7

  0

  9

 

 

    有了上面的分析,代码不难写出:

[cpp]  view plain copy
  1. //GOOGLE面试题  
  2. //一个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,找到至少一个重复元素,要求O(1)空间和O(n)时间。  
  3. //By MoreWindows (http://blog.csdn.net/MoreWindows)  
  4. #include <stdio.h>  
  5. const int NO_REPEAT_FLAG = -1;  
  6. void Swap(int &x, int &y)  
  7. {  
  8.     int t = x;  
  9.     x = y;  
  10.     y = t;  
  11. }  
  12. //类似于基数排序,找出数组中第一个重复元素。  
  13. int RadixSort(int a[], int n)  
  14. {  
  15.     int i;  
  16.     for (i = 0; i < n; i++)  
  17.     {  
  18.         while (i != a[i])  
  19.         {  
  20.             if (a[i] == a[a[i]])  
  21.                 return a[i];  
  22.             Swap(a[i], a[a[i]]);  
  23.         }  
  24.     }  
  25.     return NO_REPEAT_FLAG;  
  26. }  
  27. void PrintfArray(int a[], int n)  
  28. {  
  29.     for (int i = 0; i < n; i++)  
  30.         printf("%d ", a[i]);  
  31.     putchar('\n');  
  32. }  
  33. int main()  
  34. {  
  35.     printf("    白话经典算法系列之十 一道有趣的GOOGLE面试题 \n");        
  36.     printf(" -- by MoreWindows( http://blog.csdn.net/MoreWindows ) --\n\n");   
  37.   
  38.     const int MAXN = 10;  
  39.     int a[MAXN] = {2, 4, 1, 5, 7,  6, 1, 9, 0, 2};  
  40.     //int a[MAXN] = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9};  
  41.   
  42.     printf("数组为: \n");  
  43.     PrintfArray(a, MAXN);  
  44.   
  45.     int nRepeatNumber = RadixSort(a, MAXN);  
  46.     if (nRepeatNumber != NO_REPEAT_FLAG)  
  47.         printf("该数组有重复元素,此元素为%d\n", nRepeatNumber);  
  48.     else  
  49.         printf("该数组没有重复元素\n");  
  50.     return 0;  
  51. }  

    运行结果如下图所示:

    整个程序的核心代码只有短短5行左右,虽然有二重循环语句,但每个元素只会被访问一次,完成符合题目对时间复杂度的要求。

 

用基数排序来解决这道题目虽然思维巧妙,但会改动原数组的数据。有没有一种解法既找出一个重复的数据,又不改动数组中的数据了?请看《【白话经典算法系列之十一】一道有趣的GOOGLE面试题 --【解法2】》。

 

 

转载请标明出处,原文地址:http://blog.csdn.net/morewindows/article/details/8204460

欢迎关注微博:http://weibo.com/MoreWindows

另外,白话经典算法系列的电子书已经发布至第二版了,下载地址为:http://download.csdn.net/detail/morewindows/4560056

 

 文章转载自白话经典算法系列之十 一道有趣的GOOGLE面试题,感谢MoreWindows提供好文章

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值