索引基础
了解几个基本概念:倒排索引,单词词典,倒排列表,tf,df等
知道索引建立的大概流程,当拿到一篇文章(单字段),需要进行分词,记录一些信息,组成倒排索引.写入到磁盘中.
单词词典
建立好term到倒排列表的映射后,需要能快所的找到查询的term,继而获取对应的倒排列表,进行其余的操作,.主要有两种方式
第一种是使用哈希加链表的方式,将term先哈希后存在对应位置上的链表里.
第二种是使用B+树的方式来做(不知道如果控制查找的)