题目一描述
在一个长度为n的数组里的所有数字都在0到n-1的范围内。 数组中某些数字是重复的,但不知道有几个数字是重复的。也不知道每个数字重复几次。请找出数组中任意一个重复的数字。 例如,如果输入长度为7的数组{2,3,1,0,2,5,3},那么对应的输出是第一个重复的数字2
方法1:排序后扫描
最暴力的方法就是把输入的数组先排序,因为从排序的数组中找到重复的数字是很简单的,只要从头到尾扫描排序后的数组即可。
- 排序一个长度为n的数组需要O(nlogn)的时间,而扫描需要O(n)
方法2:使用哈希表
从头到尾扫描数组的每个数字,每扫到一个数字,都可以用O(1)的时间来判断哈希表中是否已经包含了该数字
-
如果哈希表中还没有该数字,就把它加入哈希表。
-
如果已经存在这个数字,就找到第一个重复的数字
-
这个算法的时间复杂度是O(n),但它提高时间效率是以一个大小为O(n)的哈希表为代价的。
方法3:空间复杂度O(1)的方法
题目中说明数组中的数字都在0~n-1范围内,那么如果这个数组中没有重复元素的话,下标i对应的数就是数字i。所以
- 1)从头到尾扫描这个数组中的每个数字
- 2)首先比较这个数字m是否等于当前下标i,如果等于,则继续扫描下一个数字;如果不等,则拿这个数字m和第m个数字作比较,如果相等,则就找到了第一个重复的数字,如果不等,就把第i个数字和第m个数字交换,把m放到属于它的位置。
- 3)重复这个比较、交换的过程
代码中尽管有一个两重循环,但每个数字最多只要交换两次就能找到属于它的位置,因此总的时间复杂度是O(n)。另外,所有的操作都是在原始数组上进行的,不需要额外分配内存,故空间复杂度是O(1)。
题目二描述
不修改数组找出重复的数字。
在一个长度为n+1的数组里的所有数字都在1~n的范围内,所以数组中至少有一个数字是重复的。请找出任一个重复的数字,但不能修改输入数组。
方法1:使用额外辅助数组
即创建一个长度为n+1的辅助数组,逐一将原数组的每个数字复制到辅助数组。照着题目1中的方法3做即可。但需要花费O(n)的辅助空间
方法2:二分法
把从1 ~ n的数字从中间的数字m分为两部分,前一半为1 ~ m,后一半为m + 1 ~ n。如果数组中前一半的数字数目超过m,那么这一半的区间里一定包含重复的数字;否则,含重复数字的就在另一半区间。这个过程需要统计区间里数字的数目
这个方法按照二分的思路,若输入长度为n的数组,那么count函数将被调用O(logn)次,每次需要O(n)的时间,故总的时间复杂度是O(nlogn),空间复杂度为O(1)