对于字符串定义哈希函数
其中b是基数,相当于把字符串看做b进制数。简单的数学推导可知,字符串从位置k+1 开始长度为m的字符串子串S[k+1…k+m] 的哈希值可以利用从位置k开始的字符串子串S[k…k+m-1] 的哈希值进行计算得到,转换关系如下:
首先计算将要进行匹配的较小字符串长度的子串哈希值(如下代码所示),通过不断右移得到后面字符串子串的哈希值,就可以在O(n)时间内得到所有位置的哈希值,这样在O(m+n)时间内就可以完成字符串匹配。实际中,令 , 通过自然溢出省去求模运算。
相关代码如下:
源码下载移步github:https://github.com/codeAPmind/hash-string
参考文献:《挑战程序设计竞赛》 【日】秋叶拓哉— 北川宜秥