Elasticsearch的底层搜索是以lucene来实现的。其主要是提供了一个分布式的框架来扩展了lucene,从而实现大数据量的,分布式搜索功能。其实现思想很简单,将大数据量分而治之,哈希分成多份,然后对每一份进行“lucene处理”——用lucene索引、检索,最后将每份结果合并返回。
这里主要介绍下支持这种分布式功能得以实现的数据结构。Elasticsearch中的routingtable信息。
如上图所示,Elasticsearch中的路由信息是分这么四层结构的:
1)RoutingTable:是整个集群的总体路由信息。每个Elasticsearch都可以建立多个索引,这里存储的是各个索引的信息。
2)IndexRoutingTable:是针对一个索引的路由信息。每个索引可以被拆分成不同的shard,这里存储的是各个shard的信息。
3)IndexShardRoutingTable:这个概念不好解释。Elasticsearch的shard是分为主副本的。这里的副本shard可以简单理解为对一个主