zookeeper简介
Hadoop的原始安装包下面只提供HDFS以及MapReduce两个功能,其他的生态组件需要自己安装,这里本人首先遇到的是zookeeper,一个分布式服务框架,它能提供下面这些功能:
- 配置维护
- 域名服务
- 分布式同步
- 组服务等
zookeeper维护一个类似于文件系统的服务结构,每一个文件目录都被称为是一个znode,我们可以随意增加、删除这些znode,同时znode下面是可以保存数据的。客户端注册监听它需要的znode,当这个znode发生变化的时候(数据改变、被删除、子目录节点增加删除),zookeeper会通知客户端。
举一个简单的例子,zookeeper下有一个/username目录,当前保存着字符串“tlp“,而节点node1和node2都对这个目录进行着监听。此时“tlp”发生了变化,变成了“abm”,这个时候zookeeper就会同时node1和node2自己发生了变化,变成了“abm”。
伪分布式搭建
zookeeper的伪分布式搭建类似真分布式搭建,就是将节点数量设置为1,这里要注意的是,zookeeper的服务器节点数量要是奇数个。
Java环境
Java环境的配置这里就不再赘述了,如果不知道的小伙伴可以查看本人的上一篇博客Hadoop生态(1)或者上网查找其他资料。
安装包
先去官网下载zookeeper的安装包,本人选择的版本是3.5.6。
将下载完成的压缩包放到虚拟机里去,解压,重命名文件夹
tar -zxvf apache-zookeeper-3.5.6.tar.gz
mv apache-zookeeper-3.5.6 zookeeper
把文件夹移动到自己习惯的目录
sudo mv zookeeper /usr/local
修改配置
切换到zookeeper目录下的conf目录
cd /usr/local/zookeeper/conf
安装包里给我们已经写好了一个配置文件示例,我们复制一份在里面改就可以了,本人已经复制好了,就是zoo.cfg文件。
zookeeper默认按照这个名称的配置文件进行启动配置,如果不是这样命名的话可以在稍后的启动命令后面加上配置文件的目录。
sudo cp zoo_sample.cfg zoo.cfg
打开文件修改以下内容,如果文件里已经有了就修改成和本人一样的,如果没有就自行添加
sudo gedit zoo.cfg
dataDir=/usr/local/zookeeper/data/zoo
dataLogDir=/usr/local/zookeeper/logs/zoo
clientPort=2181
server.0=127.0.0.1:2880:3880
修改完毕后保存退出
配置说明
- tickTime:这个时间是作为 zookeeper 节点之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳
- initLimit:这个是zookeeper集群中Follower服务器连接到Leader服务器时,初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 10个心跳的时间(也就是 tickTime)长度后 zookeeper 服务器还没有收到返回信息,那么表明这个节点连接失败
- syncLimit:这个配置项标识 Leader 与 Follower 之间发送消息,请求和响应的时间间隔,最长不能超过多少个 tickTime 的时间长度
- dataDir:是 zookeeper 保存数据的目录,默认情况下,zookeeper 将写数据的日志文件也保存在这个目录里
- dataLogDir:zookeeper的日志文件保存目录,如果单独配置就启用配置目录,如果没有单独配置则使用与数据相同的目录
- clientPort:这个端口就是客户端连接 zookeeper 服务器的端口,zookeeper 会监听这个端口,接受客户端的访问请求
- server.A=B:C:D:集群中的服务器配置
- A 是一个数字,表示这个是第几号服务器
- B 是这个服务器的 ip 地址
- C 表示的是这个服务器与集群中的 Leader 服务器交换信息的端口
- D 表示的是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader,而这个端口就是用来执行选举时服务器相互通信的端口
因为是伪集群的配置方式,由于 B 都是一样,所以不同的 zookeeper 实例进程通信端口号不能一样,所以要给它们分配不同的端口号
本人在这里只使用一个节点,如果想使用3个或者更多个节点,可以配置多个server,然后复制多份配置文件多开进程就好了。
创建数据和日志文件夹
手动创建和刚才配置路径一样的数据和日志文件夹。
cd /usr/local/zookeeper
sudo mkdir -p data/zoo
sudo mkdir -p logs/zoo
标识Server ID
刚才在配置文件里面指定了一台服务器0,所以需要显示地告诉zookeeper哪个文件夹下面保存的是server的数据。
切换到刚才创建的data目录下面,添加一个名为“myid”的文件,往里面写0这个数字,保存后退出
cd data/zoo
sudo gedit myid
启动测试
如果配置文件使用的是默认文件名zoo.cfg,则直接使用zkServer.sh可以启动,如果不是,则要显示指定配置文件,我们切换到zookeeper根目录底下进行测试。
cd /usr/local/zookeeper
./bin/zkServer.sh start
或者
./bin/zkServer.sh start ./conf/zoo.cfg
出现如上图所示的结果就表示启动成功了。
关闭命令(还是在刚才的目录进行测试)
./bin/zkServer.sh stop
简单使用
在正确启动zookeeper后,输入命令使用终端连接服务
./zkCli.sh
ls:查看所有znode
ls /
create:创建znode
create /test
set:修改节点内容
set /test 123
get:查看节点内容
get /test
delete:删除节点
delete /tes