题目 287. 寻找重复数
难度 中等
给定一个包含 n + 1 个整数的数组 nums,其数字都在 1 到 n 之间(包括 1 和 n),可知至少存在一个重复的整数。假设只有一个重复的整数,找出这个重复的数。
示例1:
输入: [1,3,4,2,2]
输出: 2
示例2:
输入: [3,1,3,4,2]
输出: 3
说明:
不能更改原数组(假设数组是只读的)。
只能使用额外的 O(1) 的空间。
时间复杂度小于 O(n2) 。
数组中只有一个重复的数字,但它可能不止重复出现一次。
解题思路
这道题要求我们查找的数是一个整数,并且给出了这个整数的范围(在 1 和 n 之间,包括 1 和 n),并且给出了一些限制,于是可以使用二分查找法定位在一个区间里的整数;
二分法的思路是先猜一个数(有效范围 [left, right]里的中间数 mid),然后统计原始数组中小于等于这个中间数的元素的个数 cnt,如果 cnt 严格大于 mid,(注意我加了着重号的部分「小于等于」、「严格大于」)。根据抽屉原理,重复元素就在区间 [left, mid] 里;
与绝大多数二分法问题的不同点是:正着思考是容易的,即:思考哪边区间存在重复数是容易的,因为有抽屉原理做保证。我们通过一个具体的例子来分析应该如何编写代码;
以 [2, 4, 5, 2, 3, 1, 6, 7] 为例,一共 8 个数,n + 1 = 8,n = 7,根据题目意思,每个数都在 1 和 7 之间。
例如:区间 [1, 7] 的中位数是 4,遍历整个数组,统计小于等于 4 的整数的个数,如果不存在重复元素,最多为 4 个。等于 4 的时候区间 [1, 4] 内也可能有重复元素。但是,如果整个数组里小于等于 4 的整数的个数严格大于 4 的时候,就可以说明重复的数存在于区间 [1, 4]。
说明:由于这个算法是空间敏感的,「用时间换空间」是反常规做法,算法的运行效率肯定不会高。
数据结构
二分法不需要额外的数据结构
算法
因为题目的限制,每次循环前可以计算出中位数,在判断完抽屉原理后,更换左右边界,继续判断。
实现代码(java):
public class Solution {
public int findDuplicate(int[] nums) {
int len = nums.length;
int left = 1;
int right = len - 1;
while (left < right) {
// 在 Java 里可以这么用,当 left + right 溢出的时候,无符号右移保证结果依然正确
int mid = (left + right + 1) >>> 1;
int cnt = 0;
for (int num : nums) {
if (num < mid) {
cnt += 1;
}
}
// 根据抽屉原理,严格小于 4 的数的个数如果大于等于 4 个,
// 此时重复元素一定出现在 [1, 3] 区间里
if (cnt >= mid) {
// 重复的元素一定出现在 [left, mid - 1] 区间里
right = mid - 1;
} else {
// if 分析正确了以后,else 搜索的区间就是 if 的反面
// [mid, right]
// 注意:此时需要调整中位数的取法为上取整
left = mid;
}
}
return left;
}
}