Kakfka是高吞吐量的分布式发布订阅消息系统。具备高吞吐、持久化、分布式等优秀特性。下面我们先根据下图对Kafka系统中的组件逐一介绍,再结合组件阐述其工作过程,以及各类特性实现。

Kafka系统组件
1)Producer:生产者,数据的发布者,将消息发布到Kafka的topic中。
2)Broker:服务器节点被称为Broker,每个服务器上有一个或多个kafka的实例。
3)Topic:每条发布到Kafka集群的消息都有一个类别,这个类别被称为Topic。
4)Partition:Topic中的数据分割为一个或多个partition,每个topic至少有一个partition。
每个Partition中数据使用多个segment文件存储,同一个Partition中数据是有序的,不同的Partition无法保证有序
5)Consumer:消费者,从broker中读取数据,可以消费多个topic中的数据。
6)Consumer Group:每个Consumer属于一个特定的Consumer Group。
通过该分组实现了消息的广播与单播,同一Topic的一条消息只能被同一个Consumer Group内的一个Consumer消费,但多个

Kafka是一款高吞吐的分布式消息系统,其组件包括Producer、Broker、Topic、Partition、Consumer、Consumer Group、Leader、Follower和Zookeeper。Producer通过Zookeeper找到Partition的Leader并选择路由策略发送消息。数据在Leader上写入后同步到Follower,最终存储在Partition的segment文件中,利用索引进行高效检索。
最低0.47元/天 解锁文章
6403

被折叠的 条评论
为什么被折叠?



