数据结构
老笨妞
29岁开始纯软的老笨妞。
展开
-
AC自动机1——适用于utf-8编码的Trie树
最近需要用到文本的拼音相似度计算,看了hankcs大神的hanlp里面通过ac自动机实现拼音的存储,想把它转成python版本的。开始啃AC自动机吧。 AC自动机建立在Trie树和KMP字符串匹配算法。首先啃Trie树。 关于Trie树的概念,http://blog.csdn.net/v_july_v/article/details/6897097这一篇讲得很好,还附赠了后缀树。 我所要做的原创 2017-08-01 18:22:12 · 1572 阅读 · 0 评论 -
AC自动机2——KMP字符串匹配算法
KMP算法一开始看了很久都似懂非懂的,直到看了阮一峰大侠的博客http://blog.sae.sina.com.cn/archives/307 终于觉得看懂了,然后找了一个程序, 程序如下: def compute_prefix_function(p): m = len(p) pi = [0] * m k = 0 for q in range(1, m):原创 2017-08-02 13:40:52 · 468 阅读 · 0 评论