读了张乃孝的数据结构与算法中关于KMP快速模式匹配算法的介绍,(已经写的很详细了,最好结合着后面的那个例子来看,不难理解的)。
现对于其中的一些难懂的地方做一些解释。
在计算next数组的时候(先写一下代码好了):
计算next数组:
makeNext(PSeqString p,int *next){int i = 0,k = -1;
next[0] = -1;
while(i<p->n-1){
while(k>=0&&p->c[i] != p->c[k])
k = next[k];
i++;k++;
next[i] = k;
}
}
主要就是当p->c[i] != p->c[k]时,为什么k = next[k]怎么理解呢?
首先我们应该明白,之所以执行这个语句是因为
p->c[i] != p->c[k]这个语句。
我们知道如果p0p1.....pi-1中最大相同的前缀与后缀的长度为k,那么p0....pi中最大相同的前缀与后缀的长度就有可能为k+1,。
现在因为p->c[i] != p->c[k],所以最大相同长度为k+1的机会就破灭了。
所以只能找在长度为pk之前找可能存在的最大相同的k,也就是k = next[k]。
在k中找到有可能的最大的k后,再与c[i]比较。
还有一点比较难理解的是,在对next数组计算进行改进的算法中:
if(p->c[i] == p->c[k])
next[i] = next[k];
else
next[i] = k;
这个其实不难理解,书中的解释已经很清楚了,
由于pk和tj必然不相同,所以没必要比较,直接计算下一步就好了,由于下一步的next[k]在前面肯定已经计算过,所以
next[i] = next[k]计算出来后可以更多的在匹配的时右移,加快速度。