- 博客(2)
- 收藏
- 关注
原创 浅谈Aho-Corasick automaton(AC自动机)
Aho-Corasick automaton是什么? 要学会AC自动机,我们必须知道什么是Trie,也就是字典树。Trie树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。首先我们要知道trie,而且要知道KMP,这样就可以学AC自动机了!其实AC自动机就是trie和...
2018-04-13 14:07:35 1998 2
原创 PermRLE
Description文本压缩的算法有很多种,这里给出一种叫做PermRLE的压缩算法。 定义一个整数k, PermRLE算法依赖于一种压缩顺序。所谓的压缩顺序就是一种1~k的排列。例如当k=4的时候,其中一种排列方式是{1,2,4,3},对于字符串“abdb”,按照这种排列方式进行排列之后就变成了“abbd”。 对于一段长度为Len的文本,其中k能整除Len,那么PermRLE算法就是把...
2018-04-11 12:21:45 252
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人