kafka安装和常用命令

最新推荐文章于 2023-03-28 10:33:23 发布

诸葛博仌

最新推荐文章于 2023-03-28 10:33:23 发布

阅读量713

点赞数

分类专栏： Java 文章标签： kafka 分布式 java

本文链接：https://blog.csdn.net/weixin_48811255/article/details/123097061

版权

Java 专栏收录该内容

35 篇文章 0 订阅

订阅专栏

消息队列的概念：
消息是在两台计算机之间传递的数据单位，它可以是简单的字符串，也可以是复杂的嵌入对象。消息队列是消息传递过程中保存消息的容器，将消息从源头中继到目标时充当中间人的角色。

消息队列的作用：
1.解耦：
A 系统发送数据到 BCD 三个系统，通过接口调用发送。如果 E 系统也要这个数据呢？那如果 C 系统现在不需要了呢？A 系统负责人几乎崩溃…A 系统跟其它各种乱七八糟的系统严重耦合，A 系统产生一条比较关键的数据，很多系统都需要 A 系统将这个数据发送过来。如果使用 MQ，A 系统产生一条数据，发送到 MQ 里面去，哪个系统需要数据自己去 MQ 里面消费。如果新系统需要数据，直接从 MQ 里消费即可；如果某个系统不需要这条数据了，就取消对 MQ 消息的消费即可。这样下来，A 系统压根儿不需要去考虑要给谁发送数据，不需要维护这个代码，也不需要考虑人家是否调用成功、失败超时等情况。就是一个系统或者一个模块，调用了多个系统或者模块，互相之间的调用很复杂，维护起来很麻烦。但是其实这个调用是不需要直接同步调用接口的，如果用 MQ 给它异步化解耦。

2.异步：
A 系统接收一个请求，需要在自己本地写库，还需要在 BCD 三个系统写库，自己本地写库要 3ms，BCD 三个系统分别写库要 300ms、450ms、200ms。最终请求总延时是 3 + 300 + 450 + 200 = 953ms，接近 1s，用户感觉搞个什么东西，慢死了慢死了。用户通过浏览器发起请求。如果使用 MQ，那么 A 系统连续发送 3 条消息到 MQ 队列中，假如耗时 5ms，A 系统从接受一个请求到返回响应给用户，总时长是 3 + 5 = 8ms。

3.削峰：
减少高峰时期对服务器压力。上游系统性能好，压力突然增大，下游系统性能稍差，承受不了突然增大的压力，这时候消息中间件就起到了削峰的作用。

使用场景：当系统中出现生产和消费的速度和稳定性等因素不一致的时候，使用消息队列，作为中间层，来弥合双方的差异。

消息队列的两种模式：
1.点对点模式：（一对一，消费者主动拉取数据，消息收到后消息清除）
消息生产者生产消息发送到Queue中，然后消息消费者从Queue中取出并且消费消息。消息被消费以后，queue中不再有存储，所以消息消费者不可能消费到已经被消费的消息。Queue支持存在多个消费者，但是对一个消息而言，只会有一个消费者可以消费。
在这里插入图片描述

发布/订阅模式（一对多，消费者消费数据之后不会清除消息）

消息生产者（发布）将消息发布到topic中，同时有多个消息消费者（订阅）消费该消息。和点对点方式不同，发布到topic的消息会被所有订阅者消费。
在这里插入图片描述
基本术语：
1 topic（话题）：kafka将消息分门别类，每一类的消息称之话题，是逻辑上的一个概念，如果是真正到磁盘上，映射的是一个partition的一个目录。
2 生产者（producer）: 发布消息的对象称之为生产者，只负责数据的产生，生产的来源，可以不在kafka集群上，而是来自其他的业务系统。
3 消费者(consumer):订阅消息并处理发布消息的对象，称为消费者。
4 消费者组（consumerGroup）:多个消费者可以构成消费者组，同一个消费者组的消费者，只能消费一个topic数据，不能重复消费。
5 broker : kafka本身可以是一个集群，集群中的每一个服务器都是一个代理，这个代理称为broker。只负责消息的存储，不管生产者和消费者,和他们没有任何关系。在集群中每个broker有唯一个ID，不能重复。

安装

解压缩： tar -xzvf /root/software/kafka_2.12-2.7.0.tgz -C /usr/

修改名称： mv /usr/kafka_2.12-2.7.0/ /usr/kafka

配置环境变量：vim /etc/profile
复制下面内容：
export KAFKA_HOME=/usr/kafka
export PATH= $P A T H :$ JAVA_HOME/bin: $ZK_HOME/bin:/usr/apache-tomcat-9.0.52/bin:$ KAFKA_HOME/bin

让配置文件生效： source /etc/profile

进入kafka目录： cd /usr/kafka
创建目录（存放消息），为后面配置做准备 mkdir logs
修改配置server.properties文件： vim /usr/kafka/config/server.properties
修改下面内容：
在这里插入图片描述

修改producer.properties: vim /usr/kafka/config/producer.properties 修改21行为： bootstrap.servers=cluster1:9092,cluster2:9092,cluster3:9092
修改consumer.properties:
vim /usr/kafka/config/consumer.properties
修改19行为： bootstrap.servers=cluster1:9092,cluster2:9092,cluster3:9092

修改broker.id（切记）
在cluster2和cluster3上修改broker.id
vim /usr/kafka/config/server.properties
修改21行为 broker.id=1 broker.id=2

发送环境变量配置文件：
scp -r /etc/profile cluster2:/etc/
scp -r /etc/profile cluster3:/etc/
在all session执行：
source /etc/profile
echo $KAFKA_HOME发送hosts配置文件：
scp -r /etc/hosts cluster2:/etc/
scp -r /etc/hosts cluster3:/etc/
测试是否成功：
在all session执行：
cat /etc/hosts

启动zk: /root/shelldir/zk-start-stop.sh

启动kafka: //在all session执行
kafka-server-start.sh -daemon /usr/kafka/config/server.properties

常用命令

查看当前服务器中的所有topic主题：
kafka-topics.sh --zookeeper cluster1:2181 --list

如果是zk集群可以使用这样的命令：
kafka-topics.sh --zookeeper cluster1:2181,cluster2:2181,cluster3:2181 --list

创建topic: list
kafka-topics.sh --zookeeper cluster2:2181 --create --replication-factor 2 --partitions 2 --topic goodstopic

参数说明：
–zookeeper 链接zk
–replication-factor 指定副本数目（副本数目不能大于总的brokers数目） --partitions 指定分区数
–topic 指定topic名称

删除topic:
kafka-topics.sh --zookeeper cluster1:2181 --delete --topic tp3

生产消息：
kafka-console-producer.sh --broker-list cluster2:9092 --topic goodstopic
消费消息：
kafka-console-consumer.sh --bootstrap-server cluster2:9092 --from-beginning --topic goodstopic
查看一个topic详情：
kafka-topics.sh --zookeeper cluster2:2181,cluster1:2181 --describe --topic tp1
在这里插入图片描述

partitioncount 分区总数量
replicationfactor 副本数量
partition 分区
leader 每个分区有3个副本，每个副本都有leader
replicas 所有副本节点，不管leader follower
isr: 正在服务中的节点

诸葛博仌

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
kafka安装和常用命令

消息队列的概念：消息是在两台计算机之间传递的数据单位，它可以是简单的字符串，也可以是复杂的嵌入对象。消息队列是消息传递过程中保存消息的容器，将消息从源头中继到目标时充当中间人的角色。消息队列的作用：1.解耦：A 系统发送数据到 BCD 三个系统，通过接口调用发送。如果 E 系统也要这个数据呢？那如果 C 系统现在不需要了呢？A 系统负责人几乎崩溃…A 系统跟其它各种乱七八糟的系统严重耦合，A 系统产生一条比较关键的数据，很多系统都需要 A 系统将这个数据发送过来。如果使用 MQ，A 系统产生一条
复制链接

扫一扫