hash:
1.简单介绍
就是把任意长度的输入(又叫做映射),通过hash算法,变换成固定长度的输出,该输出就是hash值。
通常运用在查找字符串中,通常的方法会一个一个的匹配字符串,这样的时间复杂度为O(n),而hash算法能将这个字符串映射为一个整数,就是哈希值。如果哈希值一样说明这个字符串一样,时间复杂度为O(1)。
2.Hash公式:
n=100010;
base=131或者1331(一个经验值,当为131或1331时不容易出现重复值)。
unsigned long long h[n],p[n];(用unsigned long long相当于自动对2^64取模,所以不用担心溢出。
h[i]=h[i-1]*base+s[i]-'a'+1;
p[i]=p[i-1]*base;
例如:
代码:
#include<stdio.h>
#include<string.h>
int base=131;
char s[1000010];
unsigned long long h[1000010];
int main()
{
scanf("%s",s+1);
int n=strlen(s+1);
for(int i=1;i<=n;i++)
{
h[i]=h[i-1]*base+s[i]-'a'+1;
}
for(int i=1;i<=n;i++)
printf("%lld\n",h[i]);
return 0;
}
除此之外,hash算法能够知道字符串的每一个前缀的哈希值,还能计算某一个子串(某一段字符串)的哈希值。
3.例题:
输入格式
第一行输入一个 DNA 字符串 S。
第二行一个数字 m,表示 m 次询问。
接下来 m 行,每行四个数字 l1,r1,l2,r2l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。
输出格式
对于每次询问,输出一行表示结果。
如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。
数据范围
1≤length(S),m≤10000001≤length(S),m≤1000000
输入样例:
aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
代码:
#include<stdio.h>
#include<string.h>
int base=131;
char s[1000010];
unsigned long long h[1000010],p[1000010];
int main()
{
int n,m,i,l1,r1,l2,r2;
scanf("%s",s+1);
n=strlen(s+1);
p[0]=1;
for(i=1;i<=n;i++)
{
h[i]=h[i-1]*base+s[i]-'a'+1;
p[i]=p[i-1]*base;
}
scanf("%d",&m);
while(m--)
{
scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
if((h[r1]-h[l1-1]*p[r1-l1+1])==(h[r2]-h[l2-1]*p[r2-l2+1]))
printf("Yes\n");
else
printf("No\n");
}
return 0;
}
4.心得:
通过对hash算法的学习,了解到查找字符串在KMP算法和BF算法之外,时间复杂度更小O(1)的哈希算法。
而且能够查找所有前缀和任意子串。