kafka笔记三 工作流程 生产者 消费者

kafka工作流程

在这里插入图片描述kafka中的数据只能保证分区内有序,不能保证全局有序

topic是逻辑上的概念,而partition是物理上的概念,可以在本地看见真实的目录

kafka文件存储机制

在这里插入图片描述由于生产者生产的消息会不断追加到 log 文件末尾,为防止 log 文件过大导致数据定位效率低下,Kafka 采取了分片索引机制,将每个 partition 分为多个 segment。每个 segment对应两个文件:
.index文件和 .log 文件。这些文件位于一个文件夹下,该文件夹的命名规则为:
topic 名称+分区序号。例如,first 这个 topic 有三个分区,则其对应的文件夹为 first-0,first-1,first-2

index 和 log 文件以当前 segment 的第一条消息的 offset 命名。

在这里插入图片描述找消息的步骤 :先在index中 查找存储消息的编号 和 每条消息的起始偏移量再去log(真正存储的消息)中查找数据(采用二分法查找)

kafka生产者

分区策略

分区的原因:

(1)方便在集群中扩展,每个 Partition 可以通过调整以适应它所在的机器,而一个 topic又可以有多个 Part

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值