Lucene索引文件格式http://blog.sina.com.cn/s/blog_56d4093701000a7d.html
Lucene会使用倒排结构存储数据的原因是:把从文档中抽取出的语汇单元看作是查找关键字,而不是把文档作为中心实体。换句话说,倒排索引并不是回答“这个文档中包含哪些单词?”这个问题,而是经过优化以后用来快速回答“哪些文档包含词X?”这个问题。
Lucene索引文件格式http://blog.sina.com.cn/s/blog_56d4093701000a7d.html
Lucene会使用倒排结构存储数据的原因是:把从文档中抽取出的语汇单元看作是查找关键字,而不是把文档作为中心实体。换句话说,倒排索引并不是回答“这个文档中包含哪些单词?”这个问题,而是经过优化以后用来快速回答“哪些文档包含词X?”这个问题。