寻找重复数
昨天刚刚做了剑指Offer的面试题03,今天遇到一个类似的题目,也是找重复的问题.
题目:
给定一个包含 n + 1 个整数的数组 nums,其数字都在 1 到 n 之间(包括 1 和 n),可知至少存在一个重复的整数。假设只有一个重复的整数,找出这个重复的数。
示例 1:
输入: [1,3,4,2,2]
输出: 2
示例 2:
输入: [3,1,3,4,2]
输出: 3
说明:
不能更改原数组(假设数组是只读的)。
只能使用额外的 O(1) 的空间。
时间复杂度小于 O(n2) 。
数组中只有一个重复的数字,但它可能不止重复出现一次。
这个说明就严格限制了做法:
首先:不能额外用长度为n的数组来统计,这就代表昨天那个题里面的,解法一不行,用哈希表存储的方法二也不行。
其次:时间复杂度小于O(n2),所以昨天那个题的方法五暴力双循环不行。
再者:不能修改原数组,所以昨天那个题里面的方法三排序,以及方法四原址哈希,都不行。
那么还有什么办法?
(我承认我看了评论和题解,我一开始真没办法)
一.借助二分法(有点绕)
首先,以前用二分查找的时候,在一个有序数组里面,找到 mid ,判断比结果大还是小,然后确定在左边还是右边继续进行二分查找,一个 while 循环,最终就可以以O(lgn)的时间复杂度得到结果。
这个题如果是对数组本身进行二分查找,显然是做不到的,因为数组的元素没有大小顺序,但是可以借助这个方法的思想。
一个重要的点是,在长度为n+1的数组里,数字的大小范围是 1到 n 。也就是数组下标范围是 0 到 n ,数字范围 1 到 n ,二分查找的数字范围和数组的下标范围是一样的。
我们用例子1来看:[1,3,4,2,2]
假设我们要找的目的值是 ans 。
对于在满足条件的从 1 到 n 范围的一个数字 i 来说,小于等于 i 的数字个数记为count
1. 如果 i 的范围是从 1 到 ans-1,count 一定是 <= i 本身的,因为这些 i 都不是我们要的ans,他们没有在数组里重复出现。
2. 等 i 是 ans 的时候, count 是 >ans 的。因为小于他的数字没有重复,一个萝卜一个坑,而他自身重复了2个及以上,那 count 就>ans了。(会不会有那种,由于小于ans的数字缺了很多个,导致这时仍然count<ans,答案是否定的,因为这道题限定的是只有一个重复数字)
3. 这样继续往后,大于 ans 的任何一个数 i ,都会满足一样的 count>ans.
也就是说我们要找的是临界的那一个数i,它是我们的答案。
对于例子1,小于等于1的数字有1个,小于等于2的有3个(count突然大于ans了,2就是答案),小于等于3的有4个,小于等于4的有5个。
下面来看具体做法:
1.初始:借助我们前面所说.这个数组里面的数字和下标的特殊关系,用下标代表结果,我们用一个变量 ans ,开始的二分游标 left 就是 1,right 是 n,(0不在数组范围),算出 mid (再次强调,注意,此是 mid