最近在研究算法,不得不说,算法是一个巧夺天工的东西;前几天就研究了一个关于字符串匹配的算法——KMP算法。
俗话所说的好,掌握一个东西就要从其最本质的最核心的原理入手;工作上广为传颂的二八原理——掌握了20%的精华,余下80%就是细枝末节,就很容易搞定了。
MP算法是基于BF算法改进,减少了字符串的重复遍历次数,其原理最主要是依靠一个非常著名的NEXT数组,理解了该数组就理解了KMP算法的核心。
NEXT数组作用:
当模式匹配字符串T与目标字符串S失配时,NEXT数组对应的元素指导应该用T字符串的哪一个元素进行下一轮的匹配。
NEXT数组元素内容的填写(关键步骤)(自己通俗易懂的理解,希望可以帮到大家):
重点是看要填的元素前缀和后缀的匹配数目,这么讲大家可能会云里雾里摸不着头脑,还是直接见图来的直快:
下面是一个实例(大家可以亲自走一遍,就会了然于胸):
T | 9 | m | n | m | n | m | m | m | n | m |
---|---|---|---|---|---|---|---|---|---|---|
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
next | x | 0 | 1 | 1 | 2 | 3 | 4 | 2 | 2 | 3 |
i(后缀)=1 2 * 3 4 5 6 7 * 8 9
j(前缀)=0 1 0 1 2 3 4 2 1 2 3
获取next数组元素的代码如下:
void GetNext(String T,int* next)
{
int i=1,j=0;
next[i]=0;
while(i<T[0])
{
if(j==0||T[i]==T[j])
{
i++;
j++;
next[i]=j;
}
else
{
j=next[j];
}
}
}
//String是模式匹配串,int*next是指向next数组的指针;
//大家根据代码自己走一遍,再对照之前的填充技巧,将会很好地理解next数组。
实践出真知,只有不停的实践,编程内功才会不断的提升;同时也要勤于思考,别人能想到的自己也一定可以想到,很多算法就是一步一步慢慢从简单堆积而来。只要比别人想的深一点点,也许将会有意想不到的收获!