集群搭建(SolrCloud分布式搜索方案)

一.SolrCloud简介

         SolrCloud(solr 云)是 Solr 提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud。当一个系统的索引数据量少的时候是不需要使用 SolrCloud的,当索引量很大,搜索请求并发很高,这时需要使用 SolrCloud 来满足这些需求。

SolrCloud 是基于 Solr 和 Zookeeper 的分布式搜索方案,它的主要思想是使用Zookeeper 作为集群的配置信息中心。

它有几个特色功能:
1)集中式的配置信息
2)自动容错
3)近实时搜索
4)查询时自动负载均衡

solrCloud系统架构:

一般用图表达的,说就有点理解困难了,我们通过一张张图逐渐深入分析

最简单的集群图 :

core这个核心代表solr库中collection

三个物理机:

然后我们看最后一样复杂的集群搭建图:

(1)物理结构:

三个solr实列,每个实列包括两个core,组成solrcloud

(2)逻辑结构:

索引集合包括两个 Shard(shard1 和 shard2),shard1 和 shard2 分别由三个 Core组成,其中一个 Leader 两个 Replication,Leader 是由 zookeeper 选举产生,zookeeper 控制每个 shard 上三个 Core 的索引数据一致,解决高可用问题。用户发起索引请求分别从 shard1 和 shard2 上获取,解决高并发问题。

collection:

collection在solrCloud中是一个逻辑意义上完整的索引结构,它常常被划分为一个或多个shard(分片),使用相同的分片信息

比如:collection=shard1 + shard2 + shard3

core:

每个core在solr中是一个独立运行的单位,提供索引和搜索服务,一个 shard 需要由一个Core 或多个 Core 组成。由于 collection 由多个 shard 组成所以 collection 一般由多个core 组成。

master或slave:

Master 是 master-slave 结构中的主结点(通常说主服务器),Slave 是 master-slave 结构中的从结点(通常说从服务器或备服务器)。同一个 Shard 下 master 和 slave 存储的数据是一致的,这是为了达到高可用目的。

shard:

Collection 的逻辑分片。每个 Shard 被化成一个或者多个 replication,通过选举确定哪个是Leader。

二.搭建SolrCloud

因为是自己搭建,我们搭建伪分布式集群:

zookeeper作为集群的管理工具

1.环境准备:

CentOS-6.5-i386-bin-DVD1.iso
jdk-7u72-linux-i586.tar.gz
apache-tomcat-7.0.47.tar.gz
zookeeper-3.4.6.tar.gz
solr-4.10.3.tgz

2.搭建集群

(1)zookeeper我们接着上次搭建好的三个zookeeper集群使用

(2)上传solr已经部署好的tomcat到linux中

(3)在linux中创建文件夹,/usr/local/solr-cloud   创建四个tomcat实列

(4)上传solrhome到linux中

(5)在 linux 中创建文件夹 /usr/local/solrhomes ,将 solrhome 复制 4 份

(6)修改每个 solr 的 web.xml 文件, 关联 solehome

(6)修改每个 tomcat 的原运行端口 8085 8080 8009 ,分别为

 

3.配置集群

(1)修改每个 tomcat 实例 bin 目录下的 catalina.sh 文件
把此配置添加到 catalina.sh 中( 第 234 行 ) :
JAVA_OPTS="-DzkHost=192.168.72.133:2181,192.168.72.133:2182,192.168.72.133:2183"
JAVA_OPTS ,顾名思义,是用来设置 JVM 相关运行参数的变量 . 此配置用于在 tomcat 启动时
找到 zookeeper 集群。


(2)配置 solrCloud 相关的配置。每个 solrhome 下都有一个 solr.xml,把其中的 ip 及端
口号配置好(是对应的 tomcat 的 IP 和端口)

(3)让 zookeeper 统一管理配置文件。需要把 solrhome 下 collection1/conf 目录上传到zookeeper。上传任意 solrhome 中的配置文件即可。
我们需要使用 solr 给我们提供的工具上传配置文件:
solr-4.10.3/example/scripts/cloud-scripts/zkcli.sh
将 solr-4.10.3 压缩包上传到 linux,解压,然后进入 solr-4.10.3/example/scripts/cloud-scripts
目录 ,执行下列命令

./zkcli.sh -zkhost 192.168.72.133:2181,192.168.72.133:2182,192.168.72.133:2183 -cmd upconfig -confdir /usr/local/solrhomes/solrhome-1/collection1/conf -confname myconf

只要上传一份就行:

参数解释
-zkhost :指定 zookeeper 地址列表
-cmd :指定命令。upconfig 为上传配置的命令
-confdir : 配置文件所在目录
-confname : 配置名称

4.启动集群

(1)启动每个 tomcat 实例。要保证 zookeeper 集群是启动状态。


(2)访问集群
地址栏输入 http://192.168.72.133:8180/solr ,可以看到 Solr 集群版的界面

5.通过springData solr 连接solrCloud

在 SolrJ 中提供一个叫做 CloudSolrServer 的类,它是 SolrServer 的子类,用于连接 solrCloud它的构造参数就是 zookeeper 的地址列表

CloudSolrServer solrServer
=new CloudSolrServer("192.168.72.133:2181,192.168.72.133:2182,192.168.72.133:2183");

另外它要求要指定 defaultCollection 属性(默认的 collection 名称)我们现在修改 springDataSolrDemo 工程的配置文件 ,把原来的 solr-server 注销,替换为CloudSolrServer .指定构造参数为地址列表,设置默认 collection 名称

<!-- solr 服务器地址
<solr:solr-server id="solrServer" url="http://192.168.25.129:8080/solr" />
-->
<bean id="solrServer" class="org.apache.solr.client.solrj.impl.CloudSolrServer">
<constructor-arg
value="192.168.72.133:2181,192.168.72.133:2182,192.168.72.133:2183" />
<property name="defaultCollection" value="collection1"></property>
</bean>

6.分片配置

(1)创建新的 Collection 进行分片处理。在浏览器输入以下地址,可以按照我们的要求 创建新的 Collection

http://192.168.72.133:8180/solr/admin/collections?action=CREATE&name= collection2 &nu
mShards=2&replicationFactor=2

参数:

name :将被创建的集合的名字
numShard s:集合创建时需要创建逻辑碎片的个数
replicationFactor :分片的副本数。
看到这个提示表示成功

 

(2)删除不用的 Collection。执行以下命令

http://192.168.25.135:8480/solr/admin/collections?action=DELETE&name=collection1

新建分片后,原来的数据已经没有了,需要重新导入索引数据。
注意:需要修改 tb_item 表 price 属性的类型为 double ,修改配置文件中默认集合的设置,再
次执行 pinyougou-solr-util 工程。如果是 BigDecimal 类型,在将数据导入到 solrCloud 集群时
会失败。

7.模拟异常

测试:
(1)停止第一个 tomcat 节点,看查询是否能正常工作 -- 能!因为还有从节点
(2)停止第三个 tomcat 节点,看看查询能够正常工作 -- 不能,因为整个一片数据全没了,
无法正常工作。
(3)恢复第三个 tomcat 节点,看看能否正常工作。恢复时间会比较长,大概 2 分半到 3 分
钟之间。请耐心等待。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

奋斗的小巍

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值