https://www.cnblogs.com/zlslch/p/6440114.html 对倒排索引讲的很好
正排索引:由document 到单词
例如: “文档1”的ID > 单词1:出现次数,出现位置列表;单词2:出现次数,出现位置列表;
倒排索引:由单词到document
例如:单词 > 文档的Id1;文档的id2
倒排索引主要由两个部分组成:“单词词典”和“倒排文件”。
单词词典:指所有被切分开来想要查询的terms
倒排文件:指的是单词词典中的term对应的信息
lucene:lucene是一个工具包,实现了全文检索的功能。
主要是创建文档对象 创建索引 然后供别人查询。