为什么 Kafka 速度快

go9898

已于 2024-04-30 15:43:38 修改

阅读量378

点赞数 10

文章标签： kafka 分布式 java 大数据 big data

于 2024-04-19 00:12:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/go9898/article/details/137942319

版权

一、Kafka 特点

1. 高吞吐、低延迟

kafka 每秒处理几十万条消息，延迟最低只有几毫秒，每个topic 可分多个 partition , consumer group 对 partition 进行 consume 操作。

2. 可扩展性

kafka集群支持热扩展

3. 持久性、可靠性

消息被持久化到本地的磁盘，并且支持数据的备份，防止数据丢失

4. 容错性

允许集群中节点失败（如果副本数量为 n, 允许 n-1 个节点失败）

5. 高并发

支持数千个客户端同时读写

二、Kafka 速度快，有以下几个原因

1. 数据保存在文件中，而不是在数据库中，并且在尾部插入

优点：文件尾部，顺序插入，避免了竞争资源，实现了写数据的高效性能

2. 放弃JVM，采用Page Cache

为了优化读写性能，Kafka利用了操作系统本身的Page Cache，就是利用操作系统自身的内存而不是JVM空间内存。这样做的好处有：

2.1 避免 Object 消耗：如果是用 Java 堆，Java对象的内存消耗相对较大，通常是所存储数据的两倍甚至更多。

2.2 避免 JVM 的 GC 问题：随着JVM中数据不断增多，垃圾回收将会变得复杂与缓慢，使用系统缓存就不会存在垃圾回收的问题

3. 批量发送数据

优点：一次发送大量数据，避免网络多次连接和握手等待

4. 零拷贝技术(zero-copy)

Kafka为了避免中间发生应用程序执行与操作系统执行的上下文切换。这种方式来读取数据比较消耗性能。

Kafka 让操作系统 Cache 中的数据发送到网卡后，传出给下游的消费者，中间跳过了两次拷贝数据的步骤，Socket 缓存中仅会拷贝一个描述符过去，不会拷贝数据到 Socket 缓存。

Kafka 的生产和消费两个过程都使用了零拷贝

4.1 网络数据持久化到磁盘，即Producer 到 Broker，使用了mmap。

4.2 磁盘文件通过网络发送，即Broker 到 Consumer，使用了DMA。

关注

10
点赞
踩
3

收藏

觉得还不错? 一键收藏
3
评论
为什么 Kafka 速度快

kafka 每秒处理几十万条消息，延迟只有几毫秒，每个topic 可分多个 partition , consumer group 对 partition 进行 consume 操作。Kafka 直接让操作系统的cache中的数据发送到网卡后传出给下游的消费者，中间跳过了两次拷贝数据的步骤，Socket缓存中仅仅会拷贝一个描述符过去，不会拷贝数据到Socket缓存。消息被持久化到本地的磁盘，并且支持数据的备份，防止数据丢失。kafka集群支持热扩展。1. 高吞吐、低延迟。3. 持久性、可靠性。
复制链接

扫一扫

go9898 CSDN认证博客专家 CSDN认证企业博客

码龄16年

16: 原创

1万+: 周排名

8万+: 总排名

5914: 访问

: 等级

303: 积分

137: 粉丝

139: 获赞

9: 评论

36: 收藏

私信

关注

热门文章

分类专栏

Java开发 9篇
解决难题 4篇
调试 4篇
微服务 3篇

最新评论

为什么 Kafka 速度快
2401_84167086: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
为什么 Kafka 速度快
CSDN-Ada助手: 恭喜你写了第9篇博客！对于为什么 Kafka 速度快这个话题的探讨非常有趣。继续保持创作的热情和努力！下一步可能可以深入研究 Kafka 的应用场景或者与其他技术的结合，给读者带来更多的启发和思考。期待你的第10篇博客！加油！
【微服务系列】服务发现的选型：用 CP 好还是 AP 好
CSDN-Ada助手: 恭喜您撰写了第10篇博客！标题看起来非常引人注目，探讨了微服务中服务发现的选型问题，CP 还是 AP 更好这个话题确实很有深度。希望您能继续坚持创作，为读者带来更多有价值的内容。或许下一步可以考虑探讨微服务架构中的容错机制或者性能优化方面的内容，相信会受到很多读者的关注。期待您的下一篇博客！
【微服务系列】BASE 分布式理论
CSDN-Ada助手: 恭喜用户在微服务系列博客中发布了第11篇文章，探讨了BASE分布式理论，内容相当丰富。希望您能继续保持创作的热情，为读者们带来更多有价值的内容。或许在下一篇博客中可以探讨一下微服务架构下的服务发现与治理，这个话题也是很有意思的。期待您的精彩续篇！
为什么 Kafka 速度快
Django知识点: 写的真好！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。