找hash最好是双hash,即分别mod两个不同的质数
第一种找哈希值的办法
转换进制
题中所述字符串中出现的字符个数为NC,则可以将其所有长度为N的子串Hash为NC进制的数,最后统计Hash的个数即可。
STEP1:记录没有出现过的字符所转化的数字,注意数字从0开始
for (int i=1;i<=len;i++){
if (id[w[i]]!=-1) continue;
id[w[i]]=cnt;
cnt++;
if (cnt>nc) break;
}
STEP2:将子串转化为NC进制的数并统计个数
for (int i=1;i<=len-n+1;i++){
s=0;
for (int j=i;j<=i+n-1;j++)
s=s*nc+id[w[j]];
if (!hash[s]){
ans++;
hash[s]=1;
}
}
第二种找哈希值的办法
一般哈希和二分答案都是合在一起考的
mod的质数不要太大,因为要平方,一般用31
例题如给出两个字符串,找从最后一个字符开始的最长相同字符串的长度
STEP1:在读入时就找出每一个字符及其前缀的哈希值
如abcd:
hash[1]=1;
hash[2]=hash[1]*31+2;
hash[3]=hash[2]*31+3;
hash[4]=hash[3]*31+4;
STEP2:选一个串来二分,二分出的长度是另一个串要找的长度,比较hash值,合法就继续向前找hash值,不合法就向后
如何找hash值:
令末尾为right,二分出的开头为mid,求出的值即为x=hash[right]-hash[mid]*31^(right-mid)
因为长度不同,所以hash[mid]需要乘上31的长度差次方之后再相减,使长度相同(补0)