由于平时编程项目时会用到Python,索性就自学了一段时间,发现Python还是很好用的,有点爱不释手。第一篇博客就献给AC自动机,这也是我所见过的神奇算法之一。
AC自动机是一种多模匹配算法,所谓多模匹配,就是模式串有多个。其主要的步骤分为三步:
1.用模式串建立字典树
字典树(Trie树)是一种变种的哈希数,存放字符串非常方便,查找效率也比较高。字典树中存放的字符串即是从根到叶子路径上所有结点值,每次插入新的字符串,在遍历字符串的同时,从根结点开始查找,若字符出现在当前结点的子结点,则转到子结点继续查找下一个字符,否则将该字符插到当前结点的子结点中。这里Python语言由于没有C/C++的结构体,所以使用类来构建出结点类。此外使用LIST类型来存放结点的子结点。
2.KMP处理