之前看的模模糊糊现在终于清楚了。
主要是这一段代码的问题
void getkmp()
{
int k=-1,j=0;
nex[0]=-1;
while(j<m)
{
if(k==-1||b[j]==b[k])
{
k++;j++;
nex[j]=k;
}
else
k=nex[k];
}
}
next[j]表示b串0~j-1的最长前缀后缀字串的长度//特别重要
例如b数组: a b a a b b a b a a b
那next数组:-1 0 0 1 1 2 0 1 2 3 4 5
设用b串来匹配大串a
设next[j]=x;
一个可以确定的就是,b串的0~x-1与 j-x~j-1 的元素是相同的
然后开始匹配,展示复杂度会被优化的地方。
串串是从i=0开始记录的
设a:abcdabcdabce 变量用j
设b:abcdabce 变量用k
a和b一个一个匹配到了a[7]='d' , b[7]='e',不相等了,然后此时k=j=7;
然后你知道了0~6他们俩都是匹配的,这个时候可以直接k=next[k]=3;j此时还是7
开始问自己,为啥k=next[k]呢?
想要从a串中找到一个b串的话,现成的匹配成功的部分就剩下了b数组的0~next[k]-1;
也就是说a的4~6(a[j-3]~a[j-1])部分与b串中的0~2,都是下划线部分相同。
这时候你就比较a[j]与b[ next[k] ]不相等就完了,此时的话就是a[7]与b[3],相等话接着匹配,直到j=b串长度的时候就相当于你匹配成功,不然就吧j继续等于next[j],反正就是能与a串尽可能相同的部分。如果一直next【k】下去等于-1,那么就没用相等的,重新从b[0]与a[j]匹配,就跟刚开始的状态是一样的。
然后就是找next数组的过程,其实与找匹配的原理一样。自己模拟一边就懂了。