关键字 Solr 缓存机制 索引结构 搜索速度
搜索引擎的缓存包括两类,一个是solr的,一个是lucene自身的。通过讲常用的数据缓存到内存,减少对磁盘的访问,能够快速的得到相要的结果。
出了缓存外,全文检索内部的索引结构---倒排序反向索引(关键字到文档的索引)和数据组织结构方式是它区别于普通数据库及数据库索引的关键。详细内容可以参考我们写的《全文检索介绍.ppt》文档。
4个solr缓存
如下:
filterCache
该缓存存储了满足一个过滤查询条件的所有文档的一个未排序的文档ID号集合。用于分面搜索和对结果排序。该缓存的key是过滤查询条件。
fieldValueCache
该缓存与lucene底层fieldCache相似,主要区别是它支持文档字段的多值(词元)情况。用于分面搜索。该缓存的key是字段名称,值为文档ID到值段字的映射。
queryResultCache
该缓存是查询结果的缓存,存储了一个排序的文档ID集合,它是满足一个查询条件的前N条查询文档。
documentCache
该缓存存储已经从磁盘取得的lucene文档对象。
Lucene缓存
fieldCache
该缓存与solr缓存fieldValueCache,该缓存的key是字段名称,值为文档ID到值段字(词元)的映射。