一文理解Kafka

Lion-King

已于 2023-05-18 13:20:39 修改

阅读量545

点赞数

分类专栏：消息中间件文章标签： kafka docker

于 2023-05-17 17:33:50 首次发布

本文链接：https://blog.csdn.net/qq_26424655/article/details/130719862

版权

概述
Kafka是一个基于Zookeeper的分布式消息中间件，支持消息分区，提供发布和订阅功能。使用Scala编写，主要特点是可水平扩展，高吞吐率以及高并发。

常见的使用场景：

企业级别活动数据和运营数据的消息传递，活动数据一般包括页面的访问，搜索。运营数据包括服务器上CPU，IO，用户活跃度等数据。
日志收集，收集的日志对接hadoop,Hbase,Elasticsearch等系统。
流式处理，支持spark streaming和storm。

基本架构以及概念
Kafka的主要工作原理是多个Producer发送Topic消息体到Kafka集群上，消息首先会存放在不同Broker对应的Leader分区上，Follower分区拉取Leader分区消息并写入日志，Consumer客户端同时也拉取Leader分区消息，完成消息消费。

上图中，Kafka集群中有3台Broker,Kafka集群在启动的时候会将自身信息注册到Zookeeper集群中，保证信息的一致性。Producer有3个，分别发送Topic为A,B,C的消息体道Kafka集群中。Kafka集群中Topic A的Partition数为2，Replication数为3，Topic B的Partition数为1，Replication数为3,Topic C的Partition数为1，Replication数为2.每个Partition有主从之分，主Partition会接收Producer消息并共Consumer消费，从Partition只会从主Partition接收数据，不会和Producer以及Cosumer有直接联系。多个Consumer可以组成一个Group，同一group下不同的Consumer只能消费同一Topic下不同Partition的消息。例如Consumer Group A下的Consumer0和Consumer1只能分别消费Topic A中Partition0和Partition1的消息。

以下是Kafka部分概念解析