kafka 集群 Topic 之 Partion 消息可靠性设计（二）

最新推荐文章于 2024-09-26 18:00:52 发布

将臣三代

最新推荐文章于 2024-09-26 18:00:52 发布

阅读量288

点赞数 5

分类专栏： Kafka 文章标签： kafka 分布式

本文链接：https://blog.csdn.net/yaoqiancuo3276/article/details/140085930

版权

kafka topic 的多个partition 存储的数据区别与关系，kafka集群，是在单个节点通过多个副本来保证
同一消息高可用，还是跨节点保证同一个消息的高可用?

在 Kafka 中，Topic 是逻辑上的数据类别，而 Partition 是物理上的分区，每个 Partition 是一个有序的、
不可变的消息队列。以下是关于 Kafka Topic 的多个 Partition 之间的数据区别与关系，以及 Kafka 集群中
如何保证消息的高可用性的详细解析。

Partition 内部数据有序：每个 Partition 内部的数据是有序的，消息按照追加的顺序存储。
Partition 之间数据无序：不同 Partition 之间的数据没有顺序关系。即使同一个 Topic 的消息在不
同 Partition 中，消息的顺序也无法保证。
独立存储：每个 Partition 独立存储消息，有自己的日志文件和索引文件。

逻辑上的一个整体：虽然每个 Partition 独立存储数据，但它们共同组成一个 Topic。Topic 中的所有
Partition 共同存储该 Topic 的所有消息。
并行处理：多个 Partition 允许并行处理，从而提高吞吐量。生产者和消费者可以并行地向不同的 Partition
写入和读取数据。

Kafka 通过副本机制和跨节点分布来实现消息的高可用性。

Leader 和 Follower：每个 Partition 有一个 Leader 和多个 Follower。Leader 负责处理所有的读写
请求，Follower 从 Leader 复制数据。
ISR 列表：In-Sync Replica（ISR）列表包含所有与 Leader 保持同步的副本。如果一个 Follower 不能及
时同步数据，它将被从 ISR 列表中移除。