kafka主题和分区的概念

kafka主题和分区的概念


1. 主题Topic

主题-topic在kafka中是⼀个逻辑的概念,kafka通过topic将消息进⾏分类。不同的topic会被订阅该topic的消费者消费。
但是有⼀个问题,如果说这个topic中的消息⾮常⾮常多,多到需要⼏T来存,因为消息是会被保存到log⽇志⽂件中的。为了解决这个⽂件过⼤的问题,kafka提出了Partition分区的概念。


2.分区Partition


通过partition将⼀个topic中的消息分区来存储。这样的好处有多个:

  • 分区存储,可以解决统-存储文件过大的问题。
  • 提供了读写的吞吐量:读和写可以同时在多个分区中进行。

在这里插入图片描述

创建多分区的主题:

./kafka-topics.sh --create --zookeeper 127.0.0.1:9093 --replicationfactor 1 --partitions 2 --topic test2

3.kafka中消息⽇志⽂件中保存的内容


00000.log: 这个文件中保存的就是消息
_consumer_offsets-49:

kafka内部自己创建了_consumer_offsets主题包含了50个分区。这个主题用来存放消费者消费某个主题的偏移量。因为每个消费者都会自己维护着消费的主题的偏移量,也就是说每个消费者会把消费的主题的偏移量自主,上报给Kafka中的默认主题:
consumer_ offsets。因此kafka为了提升这个主题的并发性,默认设置了50个分区。

  • 提交到哪个分区:通过hash函数: hash(consumerGroupld) %_ consumer_ _offsets主题的分区数
  • 提交到该主题中的内容是: key是consumerGroupld+topic+分区号, value就是当前offset的值

文件中保存的消息,默认保存7天。七天到后消息会被删除。


kafka知识点目录

1.Linux环境部署kafka
2.Win10环境部署kafka
3.docker部署kafka
4.kafka的简单使用
5.kafka消息的细节
6.kafka主题和分区的概念
7.kafka集群操作
8.kafka生产者实现细节
9.kafka消费者实现细节
10.kafka集群中的controller、rebalance、HW
11.kafka中的优化问题
12.Kafka-eagle监控平台
13.kafka错误汇总

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值