KMP的python实现

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Heathy__/article/details/60875067

用C来写KMP的时候,懂了就忘了,理解不深刻,果然还是python更直观。

KMP的next数组是关键,就几行,看懂了就能看着字符串直接写出next数组了,nice!

def getNext(pattern, next):
    j = 0
    plen = len(pattern)
    next.append(0)
    for i in range(1, plen):
        while j > 0 and pattern[j] != pattern[i]:
            j = next[j-1]
        if pattern[i] == pattern[j]:
            j = j + 1
        next.append(j)


之后就是跟主串匹配了


今日知道了KMP的next数组的另一个直观的算法。
匹配前缀和后缀的办法:
http://kb.cnblogs.com/page/176818/
"前缀"指除了最后一个字符以外,一个字符串的全部头部组合;
"后缀"指除了第一个字符以外,一个字符串的全部尾部组合。

"部分匹配"的实质是,有时候,字符串头部和尾部会有重复。比如,"ABCDAB"之中有两个"AB",那么它的"部分匹配值"就是2("AB"的长度)。搜索词移动的时候,第一个"AB"向后移动4位(字符串长度-部分匹配值),就可以来到第二个"AB"的位置。
def pattern_next(s):  
    prefix = [s[:i+1] for i in range(len(s)-1)]
    suffix = [s[i+1:] for i in range(len(s)-1)]
    l = list(set(prefix) & set(suffix))
    return len(l)



展开阅读全文

没有更多推荐了,返回首页