概念
- 散列是一种用于以常数平均时间,执行插入、删除、查找的技术。
- 散列中要查找的数据项叫做关键字(key)。
- 映射:如果表的大小是tableSize,将每个关键词与0~(tableSize-1)的下标一一对应起来的过程叫做映射。
收藏一篇博文,有点复杂啊~慢慢看QAQ 哈希表(散列表)原理详解
整数散列
散列是常用的算法思想之一,在很多程序中都会有意无意的使用到。
例子: 给出N个正整数,再给出M个正整数,问这M个数中每个数分别是否再N个数中出现过,其中N,M<=10^5, 且所有正整数均不超过10^5,假如N=5,M=3,N个正整数为{1,2,3,4,5},M个正整数为{4,5,6},那么后者中只有4,5是在N个正整数中出现过的,而6是没有出现过的。
对于这个问题,最直观的思路是:对每个欲查询的正整数x,遍历N个数,看是否有一个数与x相等。这种做法的时间复杂度为O(N*M),当N,M都很大(10^5级别)时,显然是无法承受的。
另一种想法,牺牲空间换时间,即设定一个bool型数组hashTable[10010],其中hashTable[x]=true表示正整数x在N个正整数中出现过,hashTable[x]=false表示正整数x在N个正整数中没有出现过。这样就可以在一开始读入N个正整数时就进行预处理,
即当读入的数为x时,就令hashTable[x]=true(说明:hashTable[x]数组需要初始化为false,表示初始状态下所有数都没有出现过)。于是,对M个欲查询的数,就能直接通过hashTable数组判断出每个数是否都出现过。这样做的时间复杂的为O(N+M)。
代码如下:
#include<cstdio>
const int maxn=10010;
int hashTable[maxn]={0};
int main(){
int n,m,x;
scanf("%d%d",&n,&m);
for(int i=0;i<n;i++){
scanf("%d",&x);
hashTable[x]++;
}
for(int i=0;i<m;i++){
scanf("%d",&x);
printf("%d\n",hashTable[x]);
}
return 0;
}