kafka 为什么快

最新推荐文章于 2024-07-23 14:53:02 发布

hotdust

最新推荐文章于 2024-07-23 14:53:02 发布

阅读量2.1k

点赞数

分类专栏： kafka 文章标签： kafka

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hotdust/article/details/79687850

版权

kafka 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一般的 mq 每个消息都有一个状态，这样每个消息状态改变都要更新，增加了很多随机读写。Kafka 对每个 partition 只有一个指针，而不是保存每个消息的状态，所有在指针后面的消息都是被消费过的消息。这就去掉了很多“确认消息”动作的随机读写，通过一次移动指针，来确认多个消息。
很多消息中间件，不这么做是因为实现起来有些困难。它需要在 consumer 之间进行协调，为每个 partition 选择 consumer。kafka 依赖 zookeeper 来管理这些工作。
kafka 支持批量消息处理。电脑擅长处理“线性的”扫描和传输，不擅长处理“小的”、“随机”消息。所以，把“小的”消息合并成批量处理，可能会有一点延迟，但吞吐量会上去。
kafka 重试依靠 OS pagecache 中存储的数据。说 kafka 会立刻把数据写到磁盘上，但其实不是这样的。它会写到 kernel 内存池，内存池会异步地写到磁盘上。
传统 mq 的一些缺点。传统 broker 会共享“消费状态”在 client 和 server 之间，这造成了架构更加复杂。虽然这些 mq 也实现了批处理消息功能，但 broker 会把消息保存到从内存，直到 client 去 ack 这些消息。 ack 是需要一个“很短”的 network round trip，但很多这种“很短”的 nrt 会消费很多时间。
kafka 不会存储 consumer 状态，因此它是无状态的。当有数据消费完，就会更新 zk 上的 offset 不会告诉 broker 什么。

参考：
- Kafka writes every message to broker disk. Still, performance wise it is better than some of the in-memory message storing message queues. Why is that?
- Kafka 为什么比其它的消息系统快？：上面英文资料的中文翻译，但有的地方翻译不全。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。