题目:在一个长度为n的数组里的所有数字都在0~n-1的范围内。数组中某些数字是重复的,但不知道有几个数字重复了,也不知道每个数字重复了几次。请找出数组中任意一个重复的数字。例如:如果输入长度为7的数组{2,3,1,0,2,5,3},那么对应的输出是重复的数字2或者3。
三种方法来分析此题。
方法一:先排序再遍历。先对数组中每个元素进行排序,然后重头遍历一次,找到重复的数字。这种方法所花时间主要是在排序上,一般来说对n个数字排序的时间复杂度为O(nlogn)。这当然不是我们最想要的解法。
方法二:使用散列表。我们可以使用一个长度为n的int数组arr作为散列表(可以初始化值为0),然后重头扫描目标数组,比如扫描到第一个数字2时,可以先判断arr[2]是否等于0,是则arr[2]++,不是则找到了第一个重复的数字2。这种方法总的时间复杂度虽是O(1),但需要有一个辅助数组,空间复杂度为O(n)。那有没有空间复杂度是O(1)的方法呢?
方法三:当看到题目第一句话时,我们就应该留意数组长度和数字范围的联系,这种微妙的联系极有可能对题目解题思路有帮助。我们从数组长度和数字范围分析一下,假设这个数组本身就没有重复数字,那么下标为i的值也是i,即arr[i] = i。但现在有重复数字,那就意味着有些arr[i]不是i,而是其他重复值。那我们可以一边排序(将arr[i]和i都一一对应上),一边判断哪个重复值。
如上图,我们用m来表示arr[i]的值。从数组第一个数值开始,arr[0]=2,即m=2,判断arr[m]是否等于m,不等于则交换arr[i]和arr[m],直到arr[i]等于i时操作下一个数值。
上图最后一步执行完后我们可以看见arr[0] = 0,arr[1] = 1, arr[2] = 2, arr[3] = 3。当i等于4时,arr[4]等于2,判断arr[2]是否等于2,我们发现arr[2]是等于2的,那么2就是我们找到的第一个重复的数字。
附上代码:
public static void findRepetitiveNumber(int[] numbers) {
if (ObjectUtils.isEmpty(numbers)) return;
for(int i = 0; i < numbers.length; i++) {
while (i != numbers[i]) {
int m = numbers[i];
if (m == numbers[m]) {
System.out.println("The first repetitive number is " + m);
return;
} else {
numbers[i] = numbers[m];
numbers[m] = m;
}
}
}
}
代码中尽管有一个两重循环,但每个数字最多只要交换两次就能找到属于它自己的位置,所以方法三最终时间复杂度为O(n),空间复杂度为O(1)。