题目描述
某次科研调查时得到了n个自然数,每个数均不超过1500000000(1.5*109)。已知不相同的数不超过10000个,现在需要统计这些自然数各自出现的次数,并按照自然数从小到大的顺序输出统计结果。
题目输入
多组输入数据
每组数据包含n+1行:
第1行是整数n,表示自然数的个数。
第2~n+1行每行一个自然数。
题目输出
每组数据输出包含m行(m为n个自然数中不相同数的个数),按照自然数从小到大的顺序输出。每行输出两个整数,分别是自然数和该数出现的次数,其间用一个空格隔开。
样例输入
8
2
4
2
4
5
100
2
100
样例输出
2 3
4 2
5 1
100 2
解题思路
不用HASH的思路就是定义一个结构体,里面有两个参数,一是这个数的值,一是这个数出现的次数。然后开一个10000的结构体的数组,每读到一个数,就从头检查是不是以前读到过,如果读到过就cnt++ 没有读到过就在最后面把它加上。
这个算法是对的 但是对于200000的数据O(n^2)显然不行 所以要用HASH来优化数组的使用。思路是每次读到一个数,就对它模一个与10000差不多的素数,然后用模完的值做下标(假设是t)。如果没有数就直接放进去好了。如果发现s[t].num恰好就是读到的数,那么s[t].cnt++。如果发现这个位置被占了但s[t].num不是,就依次往后找到第一个没有被占的,把其存到这里。 这样就完成了HASH对数组的优化使用。
最后把数组中所有有效的都整理一下,sort一下输出即可。
详见代码
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int maxn = 10020;
struct node {
int num;
int cnt;
};
node s[maxn];
node temp[maxn];
bool cmp(node a,node b) {
return a.num < b.num;
}
int main()
{
int n;
while(scanf("%d",&n) != EOF) {
for(int i = 1 ; i < maxn ; i ++) {
s[i].num = -1;
s[i].cnt = 1;
}
while(n--) {
int a;
scanf("%d",&a);
int t = a%10009;
while(1) {
if(s[t].num == a) {
s[t].cnt ++;
break;
}
if(s[t].num == -1) {
s[t].num = a;
break;
}
t ++;
}
}
int pt = 1;
for(int i = 1 ; i < maxn ; i ++) {
if(s[i].num != -1) {
temp[pt].num = s[i].num;
temp[pt++].cnt = s[i].cnt;
}
}
sort(temp+1,temp+pt,cmp);
for(int i = 1 ; i < pt ; i ++) {
printf("%d %d\n",temp[i].num,temp[i].cnt);
}
}
return 0;
}