C语言练习题之 数组中出现次数超过一半的数

题目描述

给一个长度为 n 的数组,数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。

例如输入一个长度为9的数组[1,2,3,2,2,2,5,4,2]。由于数字2在数组中出现了5次,超过数组长度的一半,因此输出2。

数据范围:n≤50000,数组中元素的值0≤val≤10000

要求:空间复杂度:O(1),时间复杂度O(n)

输入描述:

保证数组输入非空,且保证有解

示例1

输入:[1,2,3,2,2,2,5,4,2]

返回值:2

示例2

输入:[3,3,3,3,2,2,2]

返回值:3

示例3

输入:[1]

返回值:1

分析如下:

        题目意思比较明确,就是要找出数组中的一个数字,这个数字在数组中出现次数超过数组长度的一半。

        而题目提供的数组长度是≤50000,数组中元素的取值是 0 - 10000。

        基于这些信息,很容易从循环的角度出发,对数组每个数字进行循环统计。

代码如下:

//循环法查找
int find(int arr[], int sz)
{
	if (sz == 0)		//如果数组内没有元素,则返回-1。
		return -1;
	int i = 0;
	int j = 0;
	for (i = 0; i < sz; i++)	//遍历数组,每个数都查一遍
	{
		int count = 0;
		for (j = 0; j < sz; j++)	//数组中每个数与数组中其余数遍历一遍
		{
			if (arr[j] == arr[i] && i!= j)	//遍历过程中,与第i个数值相同,则计数+1,
			{
				count++;
			}
			if (count > sz / 2)	//当计数大于数组一半时,返回该数值。
				return arr[i];
		}
	}
}

        可以看到,循环法做起来很简单。但题目要求空间复杂度:O(1),时间复杂度O(n)。空间复杂度:O(1),即占用的内存空间不以数据量的变化而变化,无论多少数据,函数占用的内存是固定的;时间复杂度O(n),即花费的时间与数组元素成正比。

        上述解法中,空间复杂度满足,时间复杂度不满足,所以需要改进。之前我们介绍过用空间换时间的思路,即将所有可能的情况都列举出来,这里可以用一样的思路。

        根据题意,所求的返回值一定是 0-10000 这10001个数中的一个,所以如果提供一个容量为10001的数组,就可以把所求值的所有情况包含进去。然后遍历一遍即可。

代码如下:


int find(int arr[], int sz)
{
	if (sz == 0)		//如果数组内没有元素,则返回-1。
		return -1;
	int i = 0;
	int j = 0;
	int count[10001] = { 0 };	
	//题目中数组arr的取值范围是0-10000,则满足条件的数一定在这10001个数中
	//建立一个数组,包含10001个元素,对应arr数组中可能出现的10001种数值
	for (i = 0; i < sz; i++)	//遍历数组,对每种元素进行统计
		count[arr[i]]++;	//对arr数组中每种数值计数
	//如果arr数组中1出现了10次,则count[1]就是10;
	//5出现1000次,则count[5]就是1000;
	//假设n出现次数超出arr数组元素数一半,则n就是要找的值,即count[n] > sz/2

	for (i = 0; i < 10001; i++)	//遍历count数组
	{
		if (count[i] > sz / 2)	//找出满足条件的n
			return i;			//返回该值
	}
}

        这个思路可以算是穷举法。遍历过程中,arr数组中出现哪个数值,就对计数数组的对应位元素+1,统计出arr数组中每个数出现的个数,然后对技术数组遍历一遍,就能找到出现次数超过一半的数字了。

        这里空间复杂度是固定值,满足条件,时间复杂度是n+10001,也满足条件。但是占用空间过大,时间也较长,不符合实际,所以我们需要再优化。

        根据题意,所求的值 a 在数组中出现的次数一定是大于一半的。也就是说,如果对数组中的元素进行遍历,与 a 相同的数量减去与 a 不同的数量,结果一定大于0。

        那么我们假设一个 a ,从第一个数开始计算,与 a 相同则计数+1,不同则计数-1。若 a 是所求值,则最终结果大于0,返回 a;若 a 不是所求值,则将可能值赋给 a,继续计数,找到统计结果大于0的,就是所求值。

代码如下:

//优化解法
//前述解法占用内存空间太大,满足题目要求,但不符合实际。对其进行优化
//根据题意可以想到,返回值出现的次数比其余所有值出现的次数总和都多
//那么对数组元素进行计数,与返回值相同则数值+1,不同则数值-1
//因为返回值占总数一半以上,所以最后统计的数值一定大于0
//基于这个思路,从第一个元素开始计数,后一个元素与其不相等,则计数-1;相等则计数+1;
//当计数小于0时,则更换为新元素
//由于返回值占总数一半以上,所以其统计值最终必然大于0
int find(int* arr, int sz)
{
	if (sz == 0)	//如果数组内没有元素,则返回-1。
		return -1;
	int i = 0;
	int	count = 0;
	int a = arr[0];	//初始参考值设为数组第一个元素
	for (i = 0; i < sz; i++)	//遍历一遍,进行计数
	{
		if (arr[i] == a)	//第i个元素与参考值相同则计数+1
			count++;
		else				//第i个元素与参考值不相同时分项处理
		{
			if (count > 0)	//当之前计数大于0,则计数-1
				count--;
			else			//当之前计数为0,则将arr[i]赋值给参考值a,并计数为1
			{
				a = arr[i];
				count = 1;
			}
		}
	}
	return a;	//返回参考值
}
//可以看到,上述解法中,每个数值会统计一次,假设所求值是n
//参考值为n时,比较值为n, + 1,比较值为其他数, - 1;最后大于0
//参考值不为n时,比较值为n, - 1,比较值为其他数, + 1或 - 1;最后小于0,变为n,大于0
//占用内存少,且时间复杂度为O(n),满足题目要求

        可以看到,如果参考值是所求值 a,比较结束,最后结果大于0。如果参考值不是所求值 a,会被赋新值,因为所求值出现的总数最高,则遍历之后,最后 a一定会被赋值为所求值,比较结束后,结果也一定大于0。而大于0作为判断条件,就可以筛选出正确结果。

        这种解法的空间复杂度是固定值,且比较小,时间复杂度为n,满足题意。

        此方法细想容易绕晕,只要抓住核心,所求值 a 的数量占总数一半以上,就比较好理解了。以此核心为基础,在其为参考值时进行加法运算,其他数为参考值时进行减法运算,即可求得结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值