1.AVL树 平衡二叉树,这里作为最原始的、最基础的树
2.B+树 对于AVL进行了优化,数据库一般使用B+树
3.Hash树,利用【质数分辨定理】,10个最小质数,就能区分10555815270个数,10的10次幂。故复杂度最高为O(10),根据实际情况,O(5)比较常见。
4.字典树,Hash树的优化,利用相同词头进行搜索的化简,用于搜索引擎的智能联系功能。
5.搜索引擎原理:倒排索引。假如要搜索一堆博客正文中的某个词,如“Java”。做法是:先分词,再把分词作为数据库id,文章号作为value(我理解为这就是叫倒排索引的原因,因为正常来说都是id和value和这个方法相反)。
补了一些基础知识吧,重点是引发了很多思考,我觉得知识能构成网络就是真正掌握了。后面继续补充。