【剑指Offer】面试题3_1 | 不修改数组找出重复的元素 | 详细算法图解

本文链接：https://blog.csdn.net/weixin_45615071/article/details/109408994

【题目描述】

在一个长度为n+1的数组里的所有数字都在1~n的范围内，所以数组中至少有一个数字是重复的。请找出数组中任意一个重复的数字，但不能修改输入的数组。例如，如果输入长度为8的数组{2,3,5,4,3,2,6,7},那么对应的输出的重复数组是2或者3

解法一：

【思路】

这一题看起来和上一题类似。但是由于题目要求不能修改输入的数组，我们可以创建一个长度为n+1的辅助数组，然后逐一将原数组的每个数字复制到辅助数组。如果原数组中被复制的数字是m，则把它复制到辅助数组中下标为m的位置，这样就很容易发现那些元素是重复的。由于需要创建一个数组，该方案需要O(n)的辅助空间

【代码实现】

#define _CRT_SECURE_NO_WARNINGS
#include<iostream>
using namespace std;

//查找数组中所有的重复元素

void FindAllRepeat(const int *numbers, int length);

void test03_1()
{
	int arr[] = { 2,3,5,4,3,2,6,7 };

	int len = sizeof(arr) / sizeof(arr[0]);

	FindAllRepeat(arr, len);
}

int main()
{

	test03_1();

	system("pause");
	return EXIT_SUCCESS;
}

void FindAllRepeat(const int *numbers, int length)
{
	if (numbers == nullptr || length < 0)
		return;

	int arr[8] = { 0 };

	for (int i = 0; i < length; i++)
	{
		if (arr[numbers[i]] != 0)
			printf("数字%d重复\n", numbers[i]);
		else
			arr[numbers[i]] = numbers[i];
	}
}

【输出结果】

数字3重复
数字2重复
请按任意键继续. . .

解法二

【思路】

为了避免O(n)的辅助空间。为什么数组中会有重复的数字？假如没有重复的数字，那么从1~n的范围内只有n个数字。由于数组中包含的元素超过了n个，所以一定包含了重复的数字。看起来在某范围内数字的个数对解决这个问题很重要。

我们把从1~n的数字从中间的数字m分为两个部分，前一半为1 ~ m,后一半为m+1 ~ n。如果1 ~ m中的数字的数目超过了m,那么这一半的区间就一定包含了重复的数字；否则，另一半m+1 ~ n的区间里一定包含了重复的数字。我们可以继续把包含重复数字的区间一分为二，知道找到一个重复的数字。这个过程和二分查找算法很类似，知识多了一步统计区间里的数字的数目。

【图解】

示例数组：

int arr[] = {2,3,5,4,3,2,6,7};

在这里插入图片描述
【代码实现】

#define _CRT_SECURE_NO_WARNINGS
#include<iostream>
using namespace std;
//声明一个统计数值区间[start , end]中元素个数的函数
int countRange(const int *numbers, int length, int start, int end);
//声明一个选中数组numbers中重复元素的函数
int getDuplication(const int *numbers, int length);

//用于测试的函数
void test01()
{
	//待测试的数组
	int arr[] = { 2,3,5,4,3,2,6,7 };
	//int arr[] = { 1,2,3,4,5,6,7,8 };

	//计算数组的长度
	int len = sizeof(arr) / sizeof(arr[0]);
	//用于记录最终的结果
	int ret = 0;
	
	//调用函数进行重复数字的寻找
	ret = getDuplication(arr, len);

	//将寻找的结果打印输出
	if (ret = -1)
		cout << "该数组中不存在重复的元素" << endl;
	else
		cout << "找到的重复的数字为：" << ret << endl;
	
}

//主函数
int main3_2()
{

	test01();

	system("pause");
	return EXIT_SUCCESS;
}

//寻找数组中重复元素的函数getDuplication的实现
int getDuplication(const int *numbers, int length)
{
	//首先对传入参数的合法性进行检验
	if (numbers == nullptr || length <= 0)
		return -1;

	//查重区间最大元素和最小元素的值
	int start = 1;
	int end = length - 1;

	while (end >= start)
	{
		//找到查重区间最大值和最小值之间的中间值
		int middle = ((end - start) >> 1) + start;

		int count = 0;

		//计算从start到middle区间内，数组中对应元素的个数
		count = countRange(numbers, length, start, middle);

		//如果查重区间的最大值和最小值相等
		if (end == start)
		{
			//如果count大于1，说明找到了重复值，返回
			if (count > 1)
				return start;
			else //如果count的值为1,说明数组中不存在重复的数组
				break;
		}

		//如果count的值大于前半部分查重区间的不含重复元素的个数，则查重区间前半部分存在重复
		if (count > (middle - start + 1))
			end = middle;
		else//后半部分存在重复
			start = middle + 1;
	}

	return -1;
}

//实现一个统计数值区间[start , end]中元素个数的函数countRange
int countRange(const int *numbers, int length, int start, int end)
{
	//传入参数的合法性判断
	if (numbers == nullptr)
		return 0;

	int count = 0;
	//统计数组中数值在[start , end]中元素的个数
	for (int i = 0; i < length; i++)
	{
		if (numbers[i] >= start && numbers[i] <= end)
			count++;
	}

	return count;
}