什么是SolrCloud?
SolrCloud(Solr云)是Solr提供的分布式搜索方案。当一个系统的索引量很大,搜索请求并发很高时,就需要使用SolrCloud来满足这些需求。
SolrCloud是基于Solr和Zookeeper的分布式方案,它的主要思想是使用Zookeeper作为集群的配置信息中心。它有如下几个特点:
1.集中式的配置信息;
2.自动容错;
3.近实时搜索;
4.查询时自动负载均衡。
Solr集群的系统架构:
物理结构:三个Solr实例
逻辑结构:两个Shard,分别由三个Core组成,其中一个Leader两个Replication,Leager是由zookeeper选举产生,zookeeper控制每个shard上三个Core的索引数据一致,解决高可用的问题。用户发起索引请求分别从shard1和shard2上面获取,解决高并发问题。
Collection:在SolrCloud集群中是一个逻辑意义上的完整索引结构。常常被划分问一个或多个Shard(分片),他们使用相同的配置信息。
Core:Solr中一个独立的运行单位,提供索引和搜索服务。
Master/Slave:主节点/从节点,一个Shard下的master和slave存储的数据是一致的,达到了高可用的目的。
Shard:Collection的逻辑分片,每个Shard被划分为一个或多个replication,通过选举确定哪个是Leader。