Google面试题

标签: 面试题算法
220人阅读 评论(0) 收藏 举报
分类:

1. 题目描述:

  一个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,找到至少一个重复元素,要求O(1)空间和O(n)时间。


2. 题目分析:

翻译一下就是:

  • 描述:有一行N个数,这些数都比N小,而且有重复。

  • 要求:让你找到重复的数,满足“O(1)空间和O(n)时间”。

有人可能不理解空间复杂度和时间复杂度:

  • 时间复杂度:执行算法所需要的计算工作量;

  • 空间复杂度:执行这个算法所需要的内存空间;

如果你看到这里可以以迅雷不及掩耳的速度得到解决办法,那么你就离谷歌。。。还很远。



解法一:

条件1: 要求用O(n)的时间复杂度,这意味着只能遍历数组一次。
同时还要寻找重复元素,很容易想到建立哈希表来完成。

完成办法: 遍历数组时将每个元素映射到哈希表中,如果哈希表中已经存在这个元素则说明这就是个重复元素。

  因此直接使用C++ STL中的hash_set(参见《STL系列之六 set与hash_set》)可以方便的在O(n)时间内完成对重复元素的查找。

  但是:要求O(1)的空间空间复杂度,因此采用哈希表这种解法肯定在空间复杂度上是不符合要求的。

  但可以沿着哈希法的思路继续思考,题目中数组中所以数字都在范围[0, n-1],因此哈希表的大小为n即可。

  因此我们实际要做的就是对n个范围为0到n-1的数进行哈希,而哈希表的大小刚好为n。

  对排序算法比较熟悉的同学不难发现这与一种经典的排序算法——基数排序非常类似。

  而基数排序的时间空间复杂度刚好符合题目要求!
因此尝试使用基数排序来解这道面试题。

3. 例子详解

这里写图片描述

具体实现代码(C++)

这里写图片描述

这里写图片描述

解法二:
  数组中数据范围为[0,n-1],因此可以通过判断元素是否大于0来决定这个元素是未访问过的数据还是已访问过的数据。

  通过加n。这样通过判断元素是否大于等于n就能决定这个元素是未访问过的数据还是已访问过的数据。

具体实现代码(C++)

这里写图片描述


这里写图片描述

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    我的公众号

    关注微信公众号,专

    为机器学习入门者
    个人资料
    • 访问:146323次
    • 积分:3350
    • 等级:
    • 排名:第10749名
    • 原创:86篇
    • 转载:6篇
    • 译文:4篇
    • 评论:765条
    博客专栏
    最新评论