参考
- 《剑指offer》
数组中重复的数字
题目一:找出数组中重复的数字
在一个长度为n的数组里的所有数字都在0~n-1的范围内。数组中某些数字是重复的,但不知道有几个数字重复了,也不知道每个数字重复了几次。请找出数组中任意一个重复的数字
解法一
一个简单的方法是先把输入的数组排序,然后从头到尾扫描排序后的数组即可。排序一个长度为n的数组需要O(nlogn)的时间
解法二
还可以利用哈希表来解决。从头到尾按顺序扫描数组的每个数字,每扫描到一个数字的时候,都可以用O(1)的时间判断哈希表里是否包含了该数字。这个算法的时间复杂度是O(n),空间复杂度是O(n)
解法三
数组的数字都在0~n-1的范围内。如果这个数组中没有重复但是数字,那么当数组排序之后数字i将出现在下标为i的位置。由于数组中有重复的数字,有些位置可能存在多个数字,同时有些位置可能没有数字
从头到尾扫描这个数组中的每个数字。当扫描到下标为i的数字时,首先比较这个数字(用m表示)是不是等于i。如果是,则接着扫描下一个数字;如果不是,则再拿它和第m个数字进行比较。如果它和第m个数字相等,就找到了一个重复的数字(该数字在下标为i和m的位置都出现了);如果它和第m个数字不相等,就把第i个数字和第m个数字交换,把m放到属于它的位置。接下来再重复这个比较、交换的过程,直到发现一个重复的数字
bool duplicate(int numbers[], int length, int* duplication)
{
if (numbers == nullptr || length <= 0)
{
return false;
}
for (int i = 0; i < length; ++i)
{
if (numbers[i] < 0 || numbers[i] > length - 1)
{
return false;
}
}
for (int i = 0; i < length; ++i)
{
while (numbers[i] != i)
{
if (numbers[i] == numbers[numbers[i]])
{
*duplication = numbers[i];
return true;
}
int temp = numbers[i];
numbers[i] = numbers[temp];
numbers[temp] = temp;
}
}
return false;
}
每个数字最多只要交换两次就能找到属于它自己的位置,因此总的时间复杂度是O(n),空间复杂度为O(1)
题目二:不修改数组找出重复的数字
在一个长度为n+1的数组里的所有数字都在1~n的范围内,所以数组中至少有一个数字是重复的。请找出数组中任意一个重复的数字,但不能修改输入的数组
解法一
将输入的数组复制到新的数组,在新的数组上使用题目一的解法解决即可。由于需要创建一个数组,该方案需要O(n)的辅助空间
解法二
假如没有重复的数字,那么在从1~n的范围里只有n个数字。由于数组里包含超过n个数字,所以一定包含了重复的数字。把1~n的数字从中间的数字m分为两部分,前面一半为1~m,后面一半为m+1~n。如果1~m的数字的数目超过m,那么这一半的区间里一定包含重复的数字;否则,另一半m+1~n的区间里一定包含重复的数字。继续把包含重复数字的区间一分为二,直到找到一个重复的数字。这个过程和二分查找类似
int getDuplication(const int* numbers, int length)
{
if (numbers == nullptr || length <= 0)
{
return -1;
}
int start = 1;
int end = length - 1;
while (start <= end)
{
int middle = ((end - start) >> 1) + start;
int count = countRange(numbers, length, start, middle);
if (end == start)
{
if (count > 1)
{
return start;
}
else
{
break;
}
}
if (count > (middle - start + 1))
{
end = middle;
}
else
{
start = middle + 1;
}
}
return -1;
}
int countRange(const int* numbers, int length, int start, int end)
{
if (numbers == nullptr)
{
return 0;
}
int count = 0;
for (int i = 0; i < length; ++i)
{
if (numbers[i] >= start && numbers[i] <= end)
{
++count;
}
return count;
}
}
如果输入长度为n的数组,那么函数countRange将调用O(logn)次,每次需要O(n)的时间,因此总的时间复杂度O(nlogn),空间复杂度为O(1)