hash表
1.存储结构:
1.1开放寻址法
1.2 拉链法
2.字符串哈希
h(x)哈希函数
1.映射关系;
常见:mod
2.哈希冲突
冲突解决就是用1.开放寻址
2.拉链法,先建立一个hash数组,然后每个数组下面连接一条可以映射他的数组链表
例题:模拟散列数
1.向集合内插入一个数x
2.查询一个数
做法1:拉链法:
就是在每个地址下面做一个数组单链表,
#include<iostream>
#include <cstring>
using namespace std;
const int N =100003;
int h[N];
int n[N];
int ne[N];
int in;
void insert(int x){
int k=((x%N)+N)%N;
n[in]=x;
ne[in]=h[k];
h[k]=in++;
}
int find(int x){
int k=((x%N)+N)%N;
for(int i=h[k];i!=-1;i=ne[i]){
if(n[i]==x)return 1;
}
return 0;
}
int main(){
char op[2];
int x,n;
cin>>n;
memset(h,-1,sizeof h);
while(n--){
scanf("%s%d",op,&x);
if(*op=='I'){
insert(x);
}
else{
if(find(x))cout<<"Yes"<<endl;
else cout<<"No"<<endl;
}
}
}
做法2:开放寻址:
开放寻址的坑位要开到数据的两到三倍,防止陷入死循环
#include<iostream>
#include <cstring>
using namespace std;
const int N =200003,null=0x3f3f3f3f;
int h[N];
int find(int x){
int k=((x%N)+N)%N;
while(h[k]!=null && h[k]!=x){
k++;
if(k==N)k=0;
}
return k;
}
int main(){
char op[2];
int x,n;
scanf("%d",&n);
memset(h,0x3f,sizeof h);
while(n--){
scanf("%s%d",op,&x);
int k=find(x);
if(*op=='I'){
h[k]=x;
}
else{
if(h[k]!=null)puts("Yes");
else puts("No");
}
}
}
字符串哈希:
常见方式:字符串前缀哈希法
这里我们假设不会发生冲突,当p=131或者13331的时候mod数取2^64也就是unsigned long long 的一个存储范围,所以我们的哈希值直接存储这个 数据类型,溢出会自己取模。
比kmp更好,kmp唯一有一个特殊的是求循环节
哈希方法是:
abcd
1234
hash值:1p^3 +2 p^2+ 3*p+4
h[1]=a;
h[2]=ab;
h[3]=abc;
…
这样可以求出任一子区间的hash值:h[R]-h[L-1]*p^R-L+1;
常见题型:快速判断两个字符串是否相等的做法,比kmp要快。kmp可以做循环节hash不可以
#include<iostream>
#include<string>
using namespace std;
const int N = 100010;
typedef unsigned long long ULL;
const int pp=131;
ULL h[N],p[N];
char str[N];
ULL find(int a,int b){
return h[b]-h[a-1]*p[b-a+1];
}
int main(){
int n,k;
scanf("%d%d%s",&n,&k,str+1);
p[0]=1;
for(int i=1;i<=n;i++){
p[i]=p[i-1]*pp;
h[i]=h[i-1]*pp+str[i];
}
while(k--){
int a,b,c,d;
scanf("%d%d%d%d",&a,&b,&c,&d);
if(find(a,b)==find(c,d))puts("Yes");
else puts("No");
}
}