该博文主要讲解java如何使用hashMap来构建一个多叉树(类似mysql索引的 B树类型)并实现关键字识别的功能。
一:什么是B树
B树(B-tree)是有Bayer和McCreight在1972年提出的数据结构。B树索引是数据库中存取和查找文件(称为记录或键值)的一种方法,应用于磁盘读取方面。
B树(B-tree)是一种树状数据结构,它能够存储数据、对其进行排序并允许以O(log n)的时间复杂度运行进行查找、顺序读取、插入和删除的数据结构。B树,概括来说是一个节点可以拥有多于2个子节点的二叉查找树。与自平衡二叉查找树不同,B树为系统最优化大块数据的读和写操作。B-tree算法减少定位记录时所经历的中间过程,从而加快存取速度。普遍运用在数据库和文件系统。(百度百科)
二:博文所使用的树结构
类似于B树,起到索引的效果,查询效率全靠hashMap的底层优化,众所周知hashMap查询之所以快,除了他强大的匹配算法外,还因为HashMap在JDK1.8及以后的版本中引入了红黑树结构,若桶中链表元素个数大于等于8时,链表转换成树结构;若桶中链表元素个数小于等于6时,树结构还原成链表。所以最后的树结构就变成一个简单的多叉树啦😄。
三:实现代码
插入数据
public static HashMap sensitiveWordsMap = new HashMap();
public static Map initKeyWord(Set<String> keySets) {
try {
addSensitiveWordToHashMap(keySets);
} catch (Exception e) {
e.printStackTrace();
}
return sensitiveWordsMap;
}
public static void addSensitiveWordToHashMap(Set<String> keyWordSet) {
if (sensitiveWordsMap.size() == 0) {
String key = null;
Map<