NOJ1601 数次统计哈希简单应用

最新推荐文章于 2022-05-23 16:17:44 发布

Bill_Utada

最新推荐文章于 2022-05-23 16:17:44 发布

阅读量991

点赞数

分类专栏：算法与数据结构/ACM

本文链接：https://blog.csdn.net/Area_52/article/details/42797053

版权

算法与数据结构/ACM 专栏收录该内容

109 篇文章 0 订阅

订阅专栏

该博客介绍了一道编程题目，要求统计不超过1.5亿的n个自然数中不重复数字的出现次数，并按升序输出。通过哈希技术优化，将原本可能的平方时间复杂度降低，实现高效解决方案。博主分享了解题思路，包括使用哈希表存储模运算后的数值，避免线性扫描，以及最后整理并排序输出。

摘要由CSDN通过智能技术生成

题目描述

某次科研调查时得到了n个自然数，每个数均不超过1500000000（1.5*109）。已知不相同的数不超过10000个，现在需要统计这些自然数各自出现的次数，并按照自然数从小到大的顺序输出统计结果。

题目输入

多组输入数据

每组数据包含n+1行：
第1行是整数n，表示自然数的个数。
第2~n+1行每行一个自然数。

题目输出

每组数据输出包含m行（m为n个自然数中不相同数的个数），按照自然数从小到大的顺序输出。每行输出两个整数，分别是自然数和该数出现的次数，其间用一个空格隔开。

样例输入
8
2
4
2
4
5
100
2
100

样例输出
2 3
4 2
5 1
100 2

解题思路

不用HASH的思路就是定义一个结构体，里面有两个参数，一是这个数的值，一是这个数出现的次数。然后开一个10000的结构体的数组，每读到一个数，就从头检查是不是以前读到过，如果读到过就cnt++ 没有读到过就在最后面把它加上。

这个算法是对的但是对于200000的数据O(n^2)显然不行所以要用HASH来优化数组的使用。思路是每次读到一个数，就对它模一个与10000差不多的素数，然后用模完的值做下标(假设是t)。如果没有数就直接放进去好了。如果发现s[t].num恰好就是读到的数，那么s[t].cnt++。如果发现这个位置被占了但s[t].num不是，就依次往后找到第一个没有被占的，把其存到这里。这样就完成了HASH对数组的优化使用。

最后把数组中所有有效的都整理一下，sort一下输出即可。

详见代码

#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int maxn = 10020;
struct node {
    int num;
    int cnt;
};
node s[maxn];
node temp[maxn];
bool cmp(node a,node b) {
    return a.num < b.num;
}
int main()
{
    int n;
    while(scanf("%d",&n) != EOF) {
        for(int i = 1 ; i < maxn ; i ++) {
            s[i].num  = -1;
            s[i].cnt = 1;
        }
        while(n--) {
            int a;
            scanf("%d",&a);
            int t = a%10009;
            while(1) {
                if(s[t].num == a) {
                    s[t].cnt ++;
                    break;
                }
                if(s[t].num == -1) {
                    s[t].num = a;
                    break;
                }
                t ++;
            }
        }
        int pt = 1;
        for(int i = 1 ; i < maxn ; i ++) {
            if(s[i].num != -1) {
                temp[pt].num = s[i].num;
                temp[pt++].cnt = s[i].cnt;
            }
        }
        sort(temp+1,temp+pt,cmp);
        for(int i = 1 ; i < pt ; i ++) {
            printf("%d %d\n",temp[i].num,temp[i].cnt);
        }
    }
    return 0;
}