kafka体系架构详细

易～墨

于 2023-07-10 20:07:40 发布

阅读量170

点赞数

文章标签： kafka 架构分布式 big data

本文链接：https://blog.csdn.net/qq_48502775/article/details/131646914

版权

假设我们要实现一个简单的Kafka生产者和消费者程序，首先需要创建一个Kafka集群，包括多个Broker节点。然后在Kafka集群中创建一个Topic,例如"test_topic"。接下来将Topic划分为多个Partition,每个Partition包含100条消息。为了保证数据的可靠性，我们需要为每个Partition创建至少两个副本，即leader和follower。接着启动一个ConsumerGroup,其中包含多个消费者实例。在Producer端，使用Kafka提供的API将消息发送到指定的Topic和Partition中。在Consumer端，使用Kafka提供的API订阅指定的Topic和Partition。
以下是涉及的组件解释：
1. Broker(代理):Kafka集群中的每个节点都可以称为一个Broker。Broker负责接收生产者发送的消息、存储消息以及将消息分发给消费者。
2. Topic(主题):Topic是Kafka中的基本单位，它代表了一种数据类型或者业务领域。在Kafka中，所有的消息都必须被发布到一个Topic中。
3. Partition(分区):Topic可以被划分为多个Partition,每个Partition包含一定数量的消息。Partition的目的是为了提高消息的并行处理能力，同时也可以实现数据的水平扩展。
4. Replication-factor(复制因子):每个Partition可以有多个副本，副本的数量决定了消息的冗余度和可用性。通常情况下，复制因子为2,即每个Partition都有两个副本。
5. Leader(领导者):在一个Partition中，只有一个副本被认为是领导者，其他副本被称为follower。Leader负责处理客户端的读写请求，而follower则负责从leader同步数据。
6. Follower(跟随者):Follower是leader的从属节点，它会从leader处同步数据，并且只有在leader发生故障时才会接管leader的角色。
7. Consumer Group(消费者组):Consumer Group是一组消费者的集合，它们共同消费同一个Topic下的消息。每个Consumer Group都有一个唯一的标识符，用于区分不同的消费者组。
8. Consumer(消费者):Consumer是Kafka中的消息消费者，它可以从Topic中读取消息并进行处理。Consumer可以使用Kafka提供的API来订阅Topic、指定分区、设置偏移量等操作。
9. Producer(生产者):Producer是Kafka中的消息生产者，它可以将消息发送到Topic中。Producer可以使用Kafka提供的API来发送消息、指定分区、设置重试次数等操作。
10. Offset(偏移量):Offset是指消费者已经读取到的消息的位置，它是消费者与Kafka之间的一种约定。当消费者开始消费消息时，它需要先提交自己的offset值，然后根据这个offset值来读取后续的消息。