在一个长度为n+1的数组里的所有数字都在1~n的范围内,所以数组中至少有一个数字是重复的。请找出数组中任意一个重复的数字,但不能修改输入的数组。
方法1:
创建一个长度为n+1的辅助数组,然后逐一把原数组的每个数字复制到辅助数组。如果原数组中被复制的数字是m,则把它复制到辅助数组中下标为m的位置。这样就很容易发现哪个数字是重复的。但是这种方法需要创建一个数组,该方案需要O(n)的辅助区间。时间复杂度为O(n),空间复杂度为O(n)。
方法2:
首先明白,为什么数组中会有重复的数字?假如没有重复的数字,那么在从1~n的范围内只有n放数字。由于数组里包含超过n个数字,所以一定包含了重复的数字。所以,找到某范围里数字的个数是问题的关键。
我们把从1~n的数字从中间的数字m分为两部分。前面一部分为1~m,后面一部分为m+1~n。如果1~m的数字的数目超过m,那么这一半的区间里一定包含重复的数字;否则,另一半m+1~n的区间里一定包含重复的数字。我们可以继续把包含重复数字的区间一分为二,直到找到一个重复的数字。
时间复杂度为O(logn),空间复杂度为O(1)。
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
int CountRange(const int *p, int len, int start, int end)
//计算1~n的数字的数目
{
assert(p);
int count = 0;
int i = 0;
for (i = 0; i < len; i++)
{
if (*(p + i) >= start && *(p + i) <= end)
count++;
}
return count;
}
int getDuplication(const int *p, int len)
{
if (p==NULL && len <= 0)
return -1;//非法
int i = 0;
for (i = 0; i < len; i++)
{
if (*(p + i) >= len && *(p + i) < 1)
return -1;//非法
}
int start = 1;
int end = len - 1;
while (start <= end)
{
int mid = start + (end - start) / 2;
int count = CountRange(p, len, start, mid);
if (start == end)
{
if (count > 1)
return start;
else
break;
}
if (count > mid - start + 1)
end = mid;
else
start = mid + 1;
}
return 0;
}
int main()
{
int arr[] = { 2, 3, 5, 4, 3, 2, 6, 7 };
int sz = sizeof(arr) / sizeof(arr[0]);
int ret = getDuplication(&arr, sz);
if (ret == 0)
printf("没有重复数字\n");
else if (ret == -1)
printf("非法输入\n");
else
printf("重复数字:%d\n", ret);
system("pause");
return 0;
}