【Kafka】【七】主题和分区的概念

BirdMan98

于 2023-02-12 21:26:23 发布

阅读量398

点赞数

分类专栏： Kafka 文章标签： kafka 分布式 java

本文链接：https://blog.csdn.net/weixin_41405524/article/details/128999995

版权

34 篇文章 5 订阅

订阅专栏

Kafka中的主题是逻辑概念，用于分类消息。当主题消息量过大时，使用分区解决存储问题，提高读写吞吐量。每个分区存储部分消息，通过hash函数确定消息在__consumer_offsets主题中的分区，此主题用于记录消费者偏移量，保证消费状态。消息默认保存7天后会被删除。

摘要由CSDN通过智能技术生成

主题和分区的概念

主题-topic在kafka中是⼀个逻辑的概念，kafka通过topic将消息进⾏分类。不同的topic会被订阅该topic的消费者消费。

但是有⼀个问题，如果说这个topic中的消息⾮常⾮常多，多到需要⼏T来存，因为消息是会被保存到log⽇志⽂件中的。为了解决这个⽂件过⼤的问题，kafka提出了Partition分区的概念

通过partition将⼀个topic中的消息分区来存储。这样的好处有多个：

在这里插入图片描述

⼀个主题中的消息量是⾮常⼤的，因此可以通过分区的设置，来分布式存储这些消息。⽐如⼀个topic创建了3个分区。那么topic中的消息就会分别存放在这三个分区中。

./kafka-topics.sh \
--create \
--zookeeper 172.16.253.35:2181 \
--replication-factor 1 \
--partitions 2 \
--topic test1

./kafka-topics.sh \
--describe \
--zookeeper 172.16.253.35:2181 \
--topic test1

00000.log：这个⽂件中保存的就是消息
__consumer_offsets-49:
kafka内部⾃⼰创建了__consumer_offsets主题包含了50个分区。这个主题⽤来存放消费者消费某个主题的偏移量。因为每个消费者都会⾃⼰维护着消费的主题的偏移量，也就是说每个消费者会把消费的主题的偏移量⾃主上报给kafka中的默认主题：consumer_offsets。因此kafka为了提升这个主题的并发性，默认设置了50个分区。
- 提交到哪个分区：通过hash函数：hash(consumerGroupId) % __consumer_offsets主题的分区数
- 提交到该主题中的内容是：key是consumerGroupId+topic+分区号，value就是当前offset的值
⽂件中保存的消息，默认保存7天。七天到后消息会被删除。

在这里插入图片描述

关注