哈希算法就是把一个字符串用hash算法得到一个固定的值,再把其它串用同样的方法得到一个值,用二分查找的方式看看有没有一个同样的值,有就说明匹配到了
hash算法模板
#include<bits/stdc++.h>
using namespace std;
#define ull unsigned long long
ull base = 131;
ull a[10010];
char s[10010];
int main(){
int n;
scanf("%d",&n);
for(int i=1;i<=n;i++){
scanf("%s",s);
int len=strlen(s);
ull ans=0;
for(int j=0;j<len;j++){
ans = ans*base+(ull)s[j];
}
a[i]=ans;
}
sort(a+1,a+n+1);
int ans=0;
for(int i=1;i<=n;i++){
if(a[i]!=a[i-1])ans++;
}
printf("%d\n",ans);
return 0;
}
其它的hash算法问题
白兔的字符串
题目:
白兔有一个字符串T。白云有若干个字符串S1,S2…Sn。
白兔想知道,对于白云的每一个字符串,它有多少个子串是和T循环同构的。
提示:对于一个字符串a,每次把a的第一个字符移动到最后一个,如果操作若干次后能够得到字符串b,则a和b循环
同构。
所有字符都是小写英文字母
分析:将字符串T增加一倍,计算哈希值,则可得到T所有循环同构体的哈希值,并且排序。对字符串si,计算哈希值
,然后二分查询是否存在同分异构。
过题代码:
#include<bits/stdc++.h>
using namespace std;
#define ull unsigned long long
ull base = 131;
ull h[2000100];
ull q[2000100];
char s[2000100];
ull p = 1;
int main(){
scanf("%s",s);
int len=strlen(s);
int ll=len*2;
for(int i=len;i<ll;i++){
s[i]=s[i-len];
}
ull ans=0;
for(int i=0;i<len;i++){
p=p*base;
}
h[0]=s[0];
for(int i=1;i<ll;i++){
h[i] = h[i-1]*base+(ull)s[i];
}
int k=1;
q[1]=h[len-1];
for(int i=len;i<ll;i++){
q[++k]=h[i]-h[i-len]*p;
}
sort(q+1,q+k+1);
int t;
scanf("%d",&t);
while(t--){
scanf("%s",s);
int m = strlen(s);
h[0]=s[0];
for(int i=1;i<m;i++){
h[i] = h[i-1]*131+(ull)s[i];
}
ull sum;
int ans=0;
for(int i=len-1;i<m;i++){
if(i==len-1)sum=h[len-1];
else sum=h[i]-h[i-len]*p;
int x=lower_bound(q+1,q+k+1,sum)-q;
if(q[x]==sum) ans++;
}
printf("%d\n",ans);
}
return 0;
}