字符串处理是每个编程者都必须掌握的知识,主要看看字符串的搜索查找功能。
现在的编程语言如C/C++/Java等都提供了对字符串子串的查找功能,具体如下:
(1)C:strchr,strstr。
(2)C++:find,rfind,find_first_of,find_first_not_of等等。
(3)Java:indexOf,lastIndexOf等。
下面说明一种使用递归哈希进行字符串搜索/查找的方法:
(1)递归哈希
维护一个窗口,大小为n。如下公式即为起始位置为x,长度为n的窗口的哈希数值。
递归哈希主要体现在哈希数值的更新操作,减少重复的计算。下面是递归哈希的更新公式。
因为窗口[x,x+n)与[x+1,x+n+1)有n个相同的字符,在上的更新公式中我们可以看到,更新就是把“头元素”的哈希数值去掉,在加上一个新增的窗口元素。
(2)使用递归哈希进行字符串匹配
设模式串为pattern,文本为text,设定窗口大小Plen与模式串的长度相同。每次保持文本中Plen长度字符串的哈希值,当哈希值与模式串的哈希值相等时,进行字符串的具体校验。如果校验相等,报告结果。
View Code
执行输出: