在一个长度为n+1的数组里的所有数字都在1~n的范围内,所以数组中至少有一个是重复的。请找出数组中任意一个重复的数字,但不能修改输入的数组。例如,如果输入长度为8的数组{2,3,5,4,3,2,6,7},那么对应的输出是重复的数字2或者3。
思路:这道题跟 面试题:数组中重复的数字 基本一样,但是限制了不能修改输入数组,那么使用多一个辅助数组,对辅助数组进行之前的操作也是可行的,但是这道题肯定不是这个要求,所以一开始就不应该往辅助数组的路子上走。暴力法肯定也不是好的路子,那么二分法就该上场了。现在是一个无序的数组,如何二分呢?又该对谁二分呢?显然不可能是输入数组,那么只可能是输入数组中出现的1~n的数字(这数字不也可以看成时有序的么?)我们把数字1~n分为1~(n-1)/2和(n-1)/2+1~n,对分区间,遍历整个输入数组,统计前面那个区间的在输入数组中出现的次数,如果大于该区间的数字个数,那么重复数字必然出现在这个区间,否则就在另外一个区间。依照这个思路,那么我们就可以写下如下代码:
private static int GetDuplication(int[] numbers, int length)
{
if (numbers==null||length<=0)
{
return -1;
}
int start = 1;
int end = length - 1;
while (end>=start)
{
int middle = ((end - start) >> 1) + start;
int count = countRange(numbers, length, start, middle);
if (end==start)
{
if (count > 1)
{
return start;
}
else
break;
}
if (count > (middle - start + 1))
{
end = middle;
}
else
{
start = middle + 1;
}
}
return -1;
}
static int countRange(int[] numbers, int length, int start, int end)
{
if (numbers==null)
{
return 0;
}
int count = 0;
for (int i = 0; i < length; i++)
{
if (numbers[i]>=start&&numbers[i]<=end)
{
++count;
}
}
return count;
}
解析:上述代码按照二分查找的思路,如果输入长度为n的数组,那么函数countRange将被调用O(logn)次,每次需要O(n)的时间,那么函数countRange将被调用O(logn)次,每次需要O(n)的时间,因此总的时间复杂度是O(nlogn),空间复杂度为O(1)。和最前面提到的需要O(n)的辅助空间的算法相比,这种算法相当于已时间换空间。
心得:很多时候,时间和空间是处于对立面的,常规的想法都是以空间换时间(时间一般更值钱)。