最近一直有研究solr源码,所以也做一个分享吧,网上的话对SolrCloud的分享比较少,后续会对SolrCloud的分布式特性做一个介绍,如果有时间的话。由于没有牵扯到代码,所以只是流程上的分析。后续如果有时间的话,再对代码做一个详细的解释。请多多指出批评意见。
1. 首先是solrcloud的结构
这个在网上差不多都能找到相应的分析,基本就是这个概念,没有更多新的东西。
图中就是一个collection基本结构的展示。虚线的部分可以理解为一个逻辑结构,实线部分就是一个物理结构,一个SolrServer就是一个完整的solr结构,可以进行单独的运行,在cloud的逻辑中使结合zk的使用,实现一个分布式的功能,其中比较重要的一点就是OverSeer的结构,后续会进行详细说明。根据概念可以知道,一个shard只保存一份数据,leader和replica之间进行数据的同步(PeerSync以及Replication,后续也会进行说明),存储的数据是相同的。