FlashText算法:在文本中大规模检索或替换关键字的高效率算法
摘要对于一个document,size是N个characters,和一个包含了M个关键字的字典,在这个document里替换或者找到这些关键字,如果用正则匹配的方式,时间复杂度应该是O(M*N)。而FlashText算法的时间复杂度可以达到O(N)。与Aho Corasick不同,FlashText算法不会匹配sub-strings。FlashText被设计来只匹配完整的单词(两边都有边界...
翻译
2019-03-13 16:32:02 ·
3404 阅读 ·
0 评论