【题目描述】
在一个长度为n+1的数组里的所有数字都在1~n的范围内,所以数组中至少有一个数字是重复的。请找出数组中任意一个重复的数字,但不能修改输入的数组。例如,如果输入长度为8的数组{2,3,5,4,3,2,6,7},那么对应的输出的重复数组是2或者3
解法一:
【思路】
这一题看起来和上一题类似。但是由于题目要求不能修改输入的数组,我们可以创建一个长度为n+1的辅助数组,然后逐一将原数组的每个数字复制到辅助数组。如果原数组中被复制的数字是m,则把它复制到辅助数组中下标为m的位置,这样就很容易发现那些元素是重复的。由于需要创建一个数组,该方案需要O(n)的辅助空间
【代码实现】
#define _CRT_SECURE_NO_WARNINGS
#include<iostream>
using namespace std;
//查找数组中所有的重复元素
void FindAllRepeat(const int *numbers, int length);
void test03_1()
{
int arr[] = { 2,3,5,4,3,2,6,7 };
int len = sizeof(arr) / sizeof(arr[0]);
FindAllRepeat(arr, len);
}
int main()
{
test03_1();
system("pause");
return EXIT_SUCCESS;
}
void FindAllRepeat(const int *numbers, int length)
{
if (numbers == nullptr || length < 0)
return;
int arr[8] = { 0 };
for (int i = 0; i < length; i++)
{
if (arr[numbers[i]] != 0)
printf("数字%d重复\n", numbers[i]);
else
arr[numbers[i]] = numbers[i];
}
}
【输出结果】
数字3重复
数字2重复
请按任意键继续. . .
解法二
【思路】
为了避免O(n)的辅助空间。为什么数组中会有重复的数字?假如没有重复的数字,那么从1~n的范围内只有n个数字。由于数组中包含的元素超过了n个,所以一定包含了重复的数字。看起来在某范围内数字的个数对解决这个问题很重要。
我们把从1~n的数字从中间的数字m分为两个部分,前一半为1 ~ m,后一半为m+1 ~ n。如果1 ~ m中的数字的数目超过了m,那么这一半的区间就一定包含了重复的数字;否则,另一半m+1 ~ n的区间里一定包含了重复的数字。我们可以继续把包含重复数字的区间一分为二,知道找到一个重复的数字。这个过程和二分查找算法很类似,知识多了一步统计区间里的数字的数目。
【图解】
示例数组:
int arr[] = {2,3,5,4,3,2,6,7};
【代码实现】
#define _CRT_SECURE_NO_WARNINGS
#include<iostream>
using namespace std;
//声明一个统计数值区间[start , end]中元素个数的函数
int countRange(const int *numbers, int length, int start, int end);
//声明一个选中数组numbers中重复元素的函数
int getDuplication(const int *numbers, int length);
//用于测试的函数
void test01()
{
//待测试的数组
int arr[] = { 2,3,5,4,3,2,6,7 };
//int arr[] = { 1,2,3,4,5,6,7,8 };
//计算数组的长度
int len = sizeof(arr) / sizeof(arr[0]);
//用于记录最终的结果
int ret = 0;
//调用函数进行重复数字的寻找
ret = getDuplication(arr, len);
//将寻找的结果打印输出
if (ret = -1)
cout << "该数组中不存在重复的元素" << endl;
else
cout << "找到的重复的数字为:" << ret << endl;
}
//主函数
int main3_2()
{
test01();
system("pause");
return EXIT_SUCCESS;
}
//寻找数组中重复元素的函数getDuplication的实现
int getDuplication(const int *numbers, int length)
{
//首先对传入参数的合法性进行检验
if (numbers == nullptr || length <= 0)
return -1;
//查重区间最大元素和最小元素的值
int start = 1;
int end = length - 1;
while (end >= start)
{
//找到查重区间最大值和最小值之间的中间值
int middle = ((end - start) >> 1) + start;
int count = 0;
//计算从start到middle区间内,数组中对应元素的个数
count = countRange(numbers, length, start, middle);
//如果查重区间的最大值和最小值相等
if (end == start)
{
//如果count大于1,说明找到了重复值,返回
if (count > 1)
return start;
else //如果count的值为1,说明数组中不存在重复的数组
break;
}
//如果count的值大于前半部分查重区间的不含重复元素的个数,则查重区间前半部分存在重复
if (count > (middle - start + 1))
end = middle;
else//后半部分存在重复
start = middle + 1;
}
return -1;
}
//实现一个统计数值区间[start , end]中元素个数的函数countRange
int countRange(const int *numbers, int length, int start, int end)
{
//传入参数的合法性判断
if (numbers == nullptr)
return 0;
int count = 0;
//统计数组中数值在[start , end]中元素的个数
for (int i = 0; i < length; i++)
{
if (numbers[i] >= start && numbers[i] <= end)
count++;
}
return count;
}
【分析】
按照上述二分查找的思路,如果输入长度为n的数组,那么函数countRange
将被调用O(logn)
次 ,每次需要O(n)
的时间,因此总的时间的复杂度是O(nlogn)
,空间复杂度为O(1)。和解法一的算法相比,这种算法相当于时间换空间。
需要注意的是,这种算法并不能保证找出所有的重复数字。例如,该算法不能找出数组{2,3,5,4,3,2,6,7}中的重复数字2,这是因为1 ~ 2的范围内只有2个数字,这个范围的数字也只出现两次,此时该算法不能确定是每个数字各出现了一次,还是某个数字出现了两次。
从上述分析中可以看出,如果面试官提出不同的功能需求(找出任意一个重复的数字,找出所有的重复元素->解法一可以实现)或者性能需求(时间效率优先、空间效率优先),那么最终选择的算法也将不同。所以在我们动手写代码之前,一定要先与面试官交流,弄清楚面试官的需求。
更多有关于Linux C++后台开发的学习分享,感兴趣的朋友们可以关注我的个人公众号