问题
给定一个大小为n的数组,该数组包含数字的范围在 [0...k-1], k是一个正整数,k < = n。在这个数组找到重复次数最多的数字。
例如, 假设k= 10给定的数组是arr[] = {1, 2, 2, 2, 0, 2, 0, 2, 3, 8, 0, 9, 2, 3},最大的重复数量将是2。
期望的时间复杂度是O(n),空间复杂度为O(1),允许修改原数组。
分析
方法一:使用双重循环,逐个判断每个元素出现的次数,复杂度为O(n^2). 改进的做法是,使用哈希,用一个大小为k的数组count[] ,用来记录每个数字出现的次数,count[arr[i]]. 就代表 arr[i]重复的次数。这种方法遍历一次即可,但是空间复杂度为 O(k).
注意题目中的另一个条件,可以修改原数组,因此可以考虑用原数组代替 count[] 数组,为了能保证修改之后还要用到原来的数据,修改应该是可恢复的。数据范围在 [0...k-1] 内也是一个很重要的条件。这里需要用到一些简单的数学知识即可。
方法二:遍历arr[]中的元素,做如下操作 arr[arr[i]%k] += k . 之所以增加k是因为可以恢复修改过的arr[i],它最初的数据即为 arr[i] % k , 同时 arr[i] / k 就代表数字 i 出现的次数。此方法的前提是要保证计算不会溢出。但是当有多个数字重复次数一样多时只能输出其中的一个。不知各位有什么好的方法可以将多个同时输出来。
方法二代码:
#include<iostream>
using namespace std;
int FindMaxNumber(int *arr,int len, int k)
{
int i;
int ans=arr[0];
int maxCnt=0;// maxCnt/k 为当前最大的重复次数
for(i=0;i<len;i++)
{
arr[arr[i]%k]+=k;
if(maxCnt < arr[arr[i]%k])
{
maxCnt = arr[arr[i]%k];
ans = arr[i]%k;
}
}
//恢复数组
for ( i = 0; i< len; i++)
{
arr[i] = arr[i] % k;
}
return ans;
}
int main()
{
int arr[5]={3,1,3,1,1};
int num=FindMaxNumber(arr,5,4);
cout<<num<<endl;
return 0;
}