Kafka 源码解析 - Kafka背景及架构介绍

用心去追梦

于 2024-04-15 09:54:54 发布

阅读量526

点赞数 10

文章标签： kafka 架构分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33240556/article/details/137769225

版权

Apache Kafka 是一个开源的分布式流处理平台，最初由LinkedIn开发并于2011年开源，后来成为了Apache软件基金会的顶级项目。Kafka主要设计用于构建实时数据管道和流应用，它提供了统一的、高吞吐量、低延迟的数据发布和订阅解决方案。

Kafka背景与设计目标

高吞吐量: Kafka设计之初就旨在处理非常大量的实时数据，能够在单机上支持每秒数十万条消息的发布与订阅。
分布式和可扩展: Kafka采用了分布式架构，可以水平扩展，随着更多的服务器加入集群，整体吞吐量和存储容量都会线性增长。
持久化和容错: Kafka将消息持久化到磁盘，并且支持多副本冗余，确保在出现故障时数据不丢失。
实时流处理: 除了作为消息队列之外，Kafka还支持流处理，配合诸如Kafka Streams或Spark Streaming等工具可以进行实时分析和处理。

Kafka架构概述

Kafka Broker：Kafka集群中的每个节点称为Broker，负责存储和转发消息。Broker通过内部的Topic-partition模型来组织消息。
Topic：Kafka中的消息以Topic的形式存在，每个Topic可以划分为多个Partition，每个Partition都是一个有序且不可变的消息队列。
Partition：Partition是物理上的细分，每个Partition都有自己的偏移量索引（offset），并且可以分布在整个集群的Broker上。
Producer：生产者将消息发布到指定的Topic，可以决定消息进入哪个Partition，这通常基于消息的Key进行散列处理，或者由生产者显式指定。
Consumer：消费者订阅感兴趣的Topic，可以从Partitions中读取消息。消费者可以组成Consumer Group，以便在Group内部实现消息的并行消费。每个Partition在同一时间内只会被Group内的一个消费者消费。
Consumer Group：消费者组的概念使得Kafka支持广播和独占两种消息消费模式。在独占模式下，组内的消费者共同消费一个Topic的所有Partitions，确保了消息的负载均衡和仅一次消费语义。
Offset Tracking：每个Consumer Group会跟踪其消费过的每个Partition的最新偏移量，从而知道下一次应该从哪里继续消费。
Zookeeper（早期版本）：在早期版本中，Kafka使用Zookeeper进行集群管理和协调，包括存储元数据、Broker注册信息和Consumer Group的状态等。但现代Kafka已经逐渐减少了对Zookeeper的依赖，引入了KRaft协议用于自我管理和协调。

总的来说，Kafka通过其独特的分布式架构设计，实现了高效、可靠和可伸缩的消息处理能力，使之成为大数据领域中消息传递和流处理的重要基础设施。

用心去追梦

关注

10
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Kafka 源码解析 - Kafka背景及架构介绍

Kafka主要设计用于构建实时数据管道和流应用，它提供了统一的、高吞吐量、低延迟的数据发布和订阅解决方案。在独占模式下，组内的消费者共同消费一个Topic的所有Partitions，确保了消息的负载均衡和仅一次消费语义。：Kafka中的消息以Topic的形式存在，每个Topic可以划分为多个Partition，每个Partition都是一个有序且不可变的消息队列。总的来说，Kafka通过其独特的分布式架构设计，实现了高效、可靠和可伸缩的消息处理能力，使之成为大数据领域中消息传递和流处理的重要基础设施。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。