【剑指Offer】面试题3_1 | 不修改数组找出重复的元素 | 详细算法图解

题目描述

在一个长度为n+1的数组里的所有数字都在1~n的范围内,所以数组中至少有一个数字是重复的。请找出数组中任意一个重复的数字,但不能修改输入的数组。例如,如果输入长度为8的数组{2,3,5,4,3,2,6,7},那么对应的输出的重复数组是2或者3

解法一:

【思路】

这一题看起来和上一题类似。但是由于题目要求不能修改输入的数组,我们可以创建一个长度为n+1的辅助数组,然后逐一将原数组的每个数字复制到辅助数组。如果原数组中被复制的数字是m,则把它复制到辅助数组中下标为m的位置,这样就很容易发现那些元素是重复的。由于需要创建一个数组,该方案需要O(n)的辅助空间

【代码实现】

#define _CRT_SECURE_NO_WARNINGS
#include<iostream>
using namespace std;

//查找数组中所有的重复元素

void FindAllRepeat(const int *numbers, int length);

void test03_1()
{
	int arr[] = { 2,3,5,4,3,2,6,7 };

	int len = sizeof(arr) / sizeof(arr[0]);

	FindAllRepeat(arr, len);
}

int main()
{

	test03_1();

	system("pause");
	return EXIT_SUCCESS;
}

void FindAllRepeat(const int *numbers, int length)
{
	if (numbers == nullptr || length < 0)
		return;

	int arr[8] = { 0 };

	for (int i = 0; i < length; i++)
	{
		if (arr[numbers[i]] != 0)
			printf("数字%d重复\n", numbers[i]);
		else
			arr[numbers[i]] = numbers[i];
	}
}

【输出结果】

数字3重复
数字2重复
请按任意键继续. . .
解法二

【思路】

为了避免O(n)的辅助空间。为什么数组中会有重复的数字?假如没有重复的数字,那么从1~n的范围内只有n个数字。由于数组中包含的元素超过了n个,所以一定包含了重复的数字。看起来在某范围内数字的个数对解决这个问题很重要。

我们把从1~n的数字从中间的数字m分为两个部分,前一半为1 ~ m,后一半为m+1 ~ n。如果1 ~ m中的数字的数目超过了m,那么这一半的区间就一定包含了重复的数字;否则,另一半m+1 ~ n的区间里一定包含了重复的数字。我们可以继续把包含重复数字的区间一分为二,知道找到一个重复的数字。这个过程和二分查找算法很类似,知识多了一步统计区间里的数字的数目。

【图解】

示例数组:

int arr[] = {2,3,5,4,3,2,6,7};

在这里插入图片描述
【代码实现】

#define _CRT_SECURE_NO_WARNINGS
#include<iostream>
using namespace std;
//声明一个统计数值区间[start , end]中元素个数的函数
int countRange(const int *numbers, int length, int start, int end);
//声明一个选中数组numbers中重复元素的函数
int getDuplication(const int *numbers, int length);

//用于测试的函数
void test01()
{
	//待测试的数组
	int arr[] = { 2,3,5,4,3,2,6,7 };
	//int arr[] = { 1,2,3,4,5,6,7,8 };

	//计算数组的长度
	int len = sizeof(arr) / sizeof(arr[0]);
	//用于记录最终的结果
	int ret = 0;
	
	//调用函数进行重复数字的寻找
	ret = getDuplication(arr, len);

	//将寻找的结果打印输出
	if (ret = -1)
		cout << "该数组中不存在重复的元素" << endl;
	else
		cout << "找到的重复的数字为:" << ret << endl;
	
}

//主函数
int main3_2()
{

	test01();

	system("pause");
	return EXIT_SUCCESS;
}

//寻找数组中重复元素的函数getDuplication的实现
int getDuplication(const int *numbers, int length)
{
	//首先对传入参数的合法性进行检验
	if (numbers == nullptr || length <= 0)
		return -1;

	//查重区间最大元素和最小元素的值
	int start = 1;
	int end = length - 1;

	while (end >= start)
	{
		//找到查重区间最大值和最小值之间的中间值
		int middle = ((end - start) >> 1) + start;

		int count = 0;

		//计算从start到middle区间内,数组中对应元素的个数
		count = countRange(numbers, length, start, middle);

		//如果查重区间的最大值和最小值相等
		if (end == start)
		{
			//如果count大于1,说明找到了重复值,返回
			if (count > 1)
				return start;
			else //如果count的值为1,说明数组中不存在重复的数组
				break;
		}

		//如果count的值大于前半部分查重区间的不含重复元素的个数,则查重区间前半部分存在重复
		if (count > (middle - start + 1))
			end = middle;
		else//后半部分存在重复
			start = middle + 1;
	}

	return -1;
}

//实现一个统计数值区间[start , end]中元素个数的函数countRange
int countRange(const int *numbers, int length, int start, int end)
{
	//传入参数的合法性判断
	if (numbers == nullptr)
		return 0;

	int count = 0;
	//统计数组中数值在[start , end]中元素的个数
	for (int i = 0; i < length; i++)
	{
		if (numbers[i] >= start && numbers[i] <= end)
			count++;
	}

	return count;
}

【分析】

按照上述二分查找的思路,如果输入长度为n的数组,那么函数countRange将被调用O(logn)次 ,每次需要O(n)的时间,因此总的时间的复杂度是O(nlogn),空间复杂度为O(1)。和解法一的算法相比,这种算法相当于时间换空间。

需要注意的是,这种算法并不能保证找出所有的重复数字。例如,该算法不能找出数组{2,3,5,4,3,2,6,7}中的重复数字2,这是因为1 ~ 2的范围内只有2个数字,这个范围的数字也只出现两次,此时该算法不能确定是每个数字各出现了一次,还是某个数字出现了两次。

从上述分析中可以看出,如果面试官提出不同的功能需求(找出任意一个重复的数字,找出所有的重复元素->解法一可以实现)或者性能需求(时间效率优先、空间效率优先),那么最终选择的算法也将不同。所以在我们动手写代码之前,一定要先与面试官交流,弄清楚面试官的需求。


更多有关于Linux C++后台开发的学习分享,感兴趣的朋友们可以关注我的个人公众号
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值