1 过滤敏感词
1.1 利用前缀树实现过滤敏感词的算法
- 前缀树名称:Trie、字典树、查找树
- 特点:查找效率高,消耗内存大
- 应用:字符串检索、词频统计、字符串排序等
前缀树根结点不包含任何字符,除了根结点以外的结点只包含一个字符。从根结点到某个结点经过的每个路径上都有一个字符。每个结点的所有子结点包含的字符不同。如下图:
1.2 前缀树过滤敏感词的算法逻辑
假设有敏感词:
假设用户输入的内容:
要想利用算法去看看该字符串是否有敏感词,首先需要利用敏感词构造出一棵前缀树:
红色叉叉代表敏感词。
接下来,利用这个数据结构检测上述字符串是否有敏感词。
需要3个指针: