一.字符串哈希概述
字符串哈希,即得到一个字符串的哈希值。
最常见的字符串哈希函数:
将字符串转化为特定进制数并自然溢出,一般进制数最好是>300的质数。
转化时每位从1开始,假设一个字符串只有小写字符和数字组成(a~z->1~26,0~9->27~37)。
哈希碰撞(不同字符的哈希值相同)理论上是会发生的,但是概率很低,忽略不计。
二.快速得到一个字符任意子串的哈希值
其思想很类似于前缀和,可以类比学习。
假设进制位base,当前字符s,
hash数组:hash[i]记录字符串第i位结尾的子串的哈希值,
pow数组:pow[i]记录base的i次幂。
1.得到在base的所有次方,自然溢出,储存在pow数组
2.hash[i] = hash[i-1] * base + s[i]-'a'+1;
3.hash[l……r] = hash[r] - hash[l-1] * pow[r-l+1];(hash[l……r] 是(l,r)子串的哈希值)
三.应用
可以大大简化一些复杂字符串算法。
比如使用字符串哈希就可以完全替代KMP算法,而且代码简单很好理解。