集群模式下,多个zk服务器会选择出一个leader,当前leader死掉,其余服务器会继续选举。一般服务器个数为单数(why?)。leader负责管理协调其他服务器,2n+1个服务器最多允许n个服务器死掉(why?)。
1. 配置文件
配置文件/conf/zoo.cfg需要在每个服务器上都填写。以下为模板。
tickTime=2000
dataDir=/var/zookeeper/
clientPort=2181
initLimit=5
syncLimit=2
server.1=202.115.36.251:2888:3888
server.2=202.115.36.241:2888:3888
server.3=202.115.36.242:2888:3888
1.1 参数说明
initLimit
这个配置项是用来配置 Zookeeper 接受客户端(这里所说的客户端不是用户连接 Zookeeper 服务器的客户端,而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器)初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 10 个心跳的时间(也就是 tickTime)长度后 Zookeeper 服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。总的时间长度就是 5*2000=10 秒。
syncLimit
这个配置项标识 Leader 与 Follower 之间发送消息,请求和应答时间长度,最长不能超过多少个 tickTime 的时间长度,总的时间长度就是 2*2000=4 秒。
server.id=host:port:port
host即服务器ip,第一个port是集群中的该服务器与leader服务器的通信端口,第二个port是执行选举leader服务器动作的通信端口。
2. 创建myid文件
myid文件位于/conf/zoo.cfg配置文件中dataDir参数指定的目录,myid文件内容只有一个数字,即一个Server ID。例如,server.1 的myid文件内容就是“1”。注意,请确保每个server的myid文件中id数字不同,并且和server.id=host:port:port中的id一致。另外,id的范围是1~255。
3. 运行
bin目录下运行如下命令,注意要在各个服务器上都运行一下。
./zkServer.sh start
4. 测试(待补充)
echo stat|nc localhost 2181
参考:
http://blog.csdn.net/hi_kevin/article/details/7089358
http://www.cnblogs.com/ggjucheng/p/3352591.html
http://my.oschina.net/sansom/blog/157771