对ZZL字符串匹配算法的改进
——ZZL最短匹配定理
张亮
ZZL算法是一种可做特殊用途的字符串匹配算法,本文将改进ZZL算法,在ZZL算法的基础上,提出了ZZL最短匹配定理,根据模式串的自身特征以进一步减少不必要的匹配次数。
字符串匹配
字符串匹配的含义就是:在主串S中,从位置start开始查找是否存在模式串(也称作模式串)T,如在主串S中查找到一个与模式串T相同的模式串,则模式串与主串匹配;如在主串S中未查找到一个与模式串T相同的模式串,则不匹配。字符串匹配用途广泛,人们很早就对字符串匹配算法进行了研究,在BF(Brute Force)算法的基础上,提出了一些优秀的串匹配算法,比如经典的KMP匹配算法,BM算法等。
首先全文都有如下假设:
匹配的主串为S:S[1…N],长度为N;模式串为T:T[1…M],长度为M;N≥M;
ZZL匹配算法
匹配思想
现有的字符串匹配算法不论是按照模式串从左至右还是从右至左的顺序匹配,都是直接进行比较,而ZZL算法 的核心思想是:首先在主串S中查找模式串T的首字母,每找到一个则将它的位置存储,然后依次提取这些位置,从这些位置开始继续匹配模式串T。对于频繁使用 的要匹配的主串和模式串来说,由于预先保存了模式串在主串中的所有存储位置,所以匹配速度会非常快。