zookeeper + Kafka搭建

一、kafka概述

Kafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、storm/Spark流式处理引擎,web/nginx日志、访问日志,消息服务等等,用scala语言编写,Linkedin于2010年贡献给了Apache基金会并成为顶级开源 项目。

当今社会各种应用系统诸如商业、社交、搜索、浏览等像信息工厂一样不断的生产出各种信息,在大数据时代,我们面临如下几个挑战:
(1)如何收集这些巨大的信息
(2)如何分析它
(3)如何及时做到如上两点
以上几个挑战形成了一个业务需求模型,即生产者生产(produce)各种信息,消费者消费(consume)(处理分析)这些信息,而在生产者与消费者之间,需要一个沟通两者的桥梁-消息系统。从一个微观层面来说,这种需求也可理解为不同的系统之间如何传递消息。

1、消息队列通信模式

(1)、点对点模式

在这里插入图片描述
点对点模式通常是基于拉取或者轮询的消息传送模型,这个模型的特点是发送到队列的消息被一个且只有一个消费者进行处理。生产者将消息放入消息队列后,由消费者主动的去拉取消息进行消费。点对点模型的的优点是消费者拉取消息的频率可以由自己控制。但是消息队列是否有消息需要消费,在消费者端无法感知,所以在消费者端需要额外的线程去监控。

(2)、发布订阅模式

在这里插入图片描述
发布订阅模式是一个基于消息传送模型,该模型可以有多种不同的订阅者。生产者将消息放入消息队列后,队列会将消息推送给订阅过该类消息的消费者(类似微信公众号)。由于是消费者被动接收推送,所以无需感知消息队列是否有待消费的消息!但是consumer1、consumer2、consumer3由于机器性能不一样,所以处理消息的能力也会不一样,但消息队列却无法感知消费者消费的速度!所以推送的速度成了发布订阅模模式的一个问题!假设三个消费者处理速度分别是8M/s、5M/s、2M/s,如果队列推送的速度为5M/s,则consumer3无法承受!如果队列推送的速度为2M/s,则consumer1、consumer2会出现资源的极大浪费!

Kafka框架原理

Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据,具有高性能、持久化、多副本备份、横向扩展能力。
在这里插入图片描述

Producer:Producer即生产者,消息的产生者,是消息的入口。

Broker:Broker是kafka实例,每个服务器上有一个或多个kafka的实例,我们姑且认为每个broker对应一台服务器。每个kafka集群内的broker都有一个不重复的编号,如图中的broker-0、broker-1等……

Topic:消息的主题,可以理解为消息的分类,kafka的数据就保存在topic。在每个broker上都可以创建多个topic。

Partition:Topic的分区,每个topic可以有多个分区,分区的作用是做负载,提高kafka的吞吐量。同一个topic在不同的分区的数据是不重复的,partition的表现形式就是一个一个的文件夹!

Replication:每一个分区都有多个副本,副本的作用是做备胎。当主分区(Leader)故障的时候会选择一个备胎(Follower)上位,成为Leader。在kafka中默认副本的最大数量是10个,且副本的数量不能大于Broker的数量,follower和leader绝对是在不同的机器,同一机器对同一个分区也只可能存放一个副本(包括自己)。

Message:每一条发送的消息主体。

Consumer:消费者,即消息的消费方,是消息的出口

Consumer Group:我们可以将多个消费组组成一个消费者组,在kafka的设计中同一个分区的数据只能被消费者组中的某一个消费者消费。同一个消费者组的消费者可以消费同一个topic的不同分区的数据,这也是为了提高kafka的吞吐量!

Zookeeper:kafka集群依赖zookeeper来保存集群的的元信息,来保证系统的可用性。

在这里插入图片描述

消息写入leader后,follower是主动的去leader进行同步的!producer采用push模式将数据发布到broker,每条消息追加到分区中,顺序写入磁盘,所以保证同一分区内的数据是有序的!

在这里插入图片描述

二、部署zookeeper集群

环境:

192.168.100.114 ——zookeeper1
192.168.100.115 —— zookeeper2
192.168.100.116 ——zookeeper3

1、检查关闭三台主机的防火墙、selinux,安装工具包文件

三台主机一样的进行配置

//检查firewalld是否关闭
systemctl status firewalld

//检查selinux是否关闭
getenforce
//安装工具包
yum -y install lrzsz tar chrony
systemctl restart chronyd
systemctl enable chronyd
hwclock -w
timedatectl   //验证System clock synchronized: yes是否为yes

2、安装Java

三台主机都创建/opt/software目录,更改环境变量

三台主机都是一样的操作,这里我就用zookeeper1来演示

[root@zookeeper1 ~]# mkdir /opt/software
[root@zookeeper1 ~]# cd /opt/software/
[root@zookeeper1 software]# rz -E
rz waiting to receive.
[root@zookeeper1 software]# ls
jdk-8u181-linux-x64.tar.gz

解压jdk包文件,修改环境变量

[root@zookeeper1 software]# tar -zxvf jdk-8u181-linux-x64.tar.gz

[root@zookeeper1 software]# vim /etc/profile   
//在该文件最末尾后面添加
export JAVA_HOME=/opt/software/jdk1.8.0_181
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

将java目录和/etc/profile都发送到zookeeper2和zookeeper3

//这里我就直接用scp传输到另外两台主机了
[root@zookeeper1 software]# scp -r jdk1.8.0_181/ root@192.168.100.115:/opt/software/
[root@zookeeper1 software]# scp -r jdk1.8.0_181/ root@192.168.100.116:/opt/software/

[root@zookeeper1 software]# scp /etc/profile root@192.168.100.115:/etc/profile
[root@zookeeper1 software]# scp /etc/profile root@192.168.100.116:/etc/profile

三台主机全部都source一下/etc/profile

[root@zookeeper1 software]# source /etc/profile

[root@zookeeper2 software]# source /etc/profile

[root@zookeeper3 software]# source /etc/profile

3、安装zookeeper

每个节点都安装

[root@zookeeper1 software]# rz -E
rz waiting to receive.
[root@zookeeper1 software]# ls
jdk1.8.0_181  jdk-8u181-linux-x64.tar.gz  zookeeper-3.4.8.tar.gz
[root@zookeeper1 software]# tar -zxvf zookeeper-3.4.8.tar.gz 

[root@zookeeper1 software]# mv zookeeper-3.4.8 zookeeper
[root@zookeeper1 software]# cd zookeeper/
[root@zookeeper1 zookeeper]# mkdir data logs
[root@zookeeper1 zookeeper]# ls
bin          contrib     ivysettings.xml  logs                  recipes                  zookeeper-3.4.8.jar.md5
build.xml    data        ivy.xml          NOTICE.txt            src                      zookeeper-3.4.8.jar.sha1
CHANGES.txt  dist-maven  lib              README_packaging.txt  zookeeper-3.4.8.jar
conf         docs        LICENSE.txt      README.txt            zookeeper-3.4.8.jar.asc
[root@zookeeper1 zookeeper]# cd conf/
[root@zookeeper1 conf]# cp zoo_sample.cfg zoo.cfg
[root@zookeeper1 conf]# ls
configuration.xsl  log4j.properties  zoo.cfg  zoo_sample.cfg

[root@zookeeper1 conf]# vim zoo.cfg 
//修改 dataDir 参数内容如下
dataDir=/opt/software/zookeeper/data

//在文件最末加上
server.1=192.168.100.114:2888:3888
server.2=192.168.100.115:2888:3888
server.3=192.168.100.116:2888:3888

[root@zookeeper1 software]# echo 1 > /opt/software/zookeeper/data/myid

//将zookeeper发送给另外两台主机
[root@zookeeper1 software]# scp -r zookeeper/ root@192.168.100.115:/opt/software/
[root@zookeeper1 software]# scp -r zookeeper/ root@192.168.100.116:/opt/software/

[root@zookeeper2 software]# echo 2 > /opt/software/zookeeper/data/myid
[root@zookeeper3 software]# echo 3 > /opt/software/zookeeper/data/myid

//配置zookeeper的环境变量
[root@zookeeper1 software]# vim /etc/profile
//在文件最后再加上两行信息
export ZOOKEEPER_HOME=/opt/software/zookeeper
export PATH=$PATH:$ZOOKEEPER_HOME/bin

///etc/profile文件发给节点23
[root@zookeeper1 software]# scp /etc/profile root@192.168.100.115:/etc/profile
[root@zookeeper1 software]# scp /etc/profile root@192.168.100.116:/etc/profile


//三台主机全部都source一下/etc/profile
[root@zookeeper1 software]# source /etc/profile
[root@zookeeper2 software]# source /etc/profile
[root@zookeeper3 software]# source /etc/profile

4、三台主机都启动zookeeper,查看状态

zookeeper1节点

[root@zookeeper1 software]# zkServer.sh start
ZooKeeper JMX enabled by default
Using config: /opt/software/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
[root@zookeeper1 software]# zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/software/zookeeper/bin/../conf/zoo.cfg
Mode: follower

zookeeper2节点

[root@zookeeper2 software]# zkServer.sh start
ZooKeeper JMX enabled by default
Using config: /opt/software/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
[root@zookeeper2 software]# zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/software/zookeeper/bin/../conf/zoo.cfg
Mode: leader

zookeeper3节点

[root@zookeeper3 software]# zkServer.sh start
ZooKeeper JMX enabled by default
Using config: /opt/software/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
[root@zookeeper3 software]# zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/software/zookeeper/bin/../conf/zoo.cfg
Mode: follower

三、安装kafka

1、解压kafka

[root@zookeeper1 software]# rz -E
rz waiting to receive.
[root@zookeeper1 software]# ls ~
anaconda-ks.cfg  zookeeper.out
[root@zookeeper1 software]# ls
jdk1.8.0_181  kafka_2.11-2.4.0.tgz  zookeeper  zookeeper.out

//解压kafka
[root@zookeeper1 software]# tar -zxvf kafka_2.11-2.4.0.tgz 
[root@zookeeper1 software]# mv kafka_2.11-2.4.0 kafka
[root@zookeeper1 software]# ls
jdk1.8.0_181  kafka  kafka_2.11-2.4.0.tgz  zookeeper  zookeeper.out

2、编辑kafka配置文件

[root@zookeeper1 software]# vim kafka/config/server.properties
//在配置文件中找到以下两行并注释掉(在文本前加#)如下所示:
#broker.id=0
#zookeeper.connect=localhost:2181
添加
broker.id=1
zookeeper.connect=192.168.100.114:2181,192.168.115.20:2181,192.168.100.116:2181
listeners = PLAINTEXT://192.168.100.114:9092

3、将kafka发送给另外两台主机并修改配置文件

[root@zookeeper1 software]# scp -r kafka root@192.168.100.115:/opt/software/
[root@zookeeper1 software]# scp -r kafka root@192.168.100.116:/opt/software/

//zookeeper2主机
[root@zookeeper2 ~]# vim /opt/software/kafka/config/server.properties
//修改以下内容
broker.id=2
listeners = PLAINTEXT://192.168.200.115:9092

//zookeeper3主机
[root@zookeeper3 ~]# vim /opt/software/kafka/config/server.properties
//修改以下内容
broker.id=3
listeners = PLAINTEXT://192.168.200.116:9092

4、启动kafka

三台主机全部启动kafka

[root@zookeeper1 software]# ./kafka/bin/kafka-server-start.sh -daemon ./kafka/config/server.properties
[root@zookeeper1 software]# jps
704 QuorumPeerMain
1179 Kafka
1245 Jps

[root@zookeeper2 software]# ./kafka/bin/kafka-server-start.sh -daemon ./kafka/config/server.properties
[root@zookeeper2 software]# jps
1221 Jps
1158 Kafka
695 QuorumPeerMain


[root@zookeeper3 software]# ./kafka/bin/kafka-server-start.sh -daemon ./kafka/config/server.properties
[root@zookeeper3 software]# jps
1629 QuorumPeerMain
2045 Jps
1982 Kafka

5、测试

[root@zookeeper1 software]# ./kafka/bin/kafka-topics.sh --create --zookeeper 192.168.100.114:2181 --replication-factor 1 --partitions 1 --topic test
Created topic test.

[root@zookeeper2 software]# ./kafka/bin/kafka-topics.sh --list --zookeeper 192.168.100.115:2181
test

[root@zookeeper3 software]# ./kafka/bin/kafka-topics.sh --list --zookeeper 192.168.100.116:2181
test

  • 17
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值