Kafka是如何实现高性能的

最新推荐文章于 2024-06-27 08:22:14 发布

明斯克开源

最新推荐文章于 2024-06-27 08:22:14 发布

阅读量194

点赞数

分类专栏： Java 文章标签：经验分享架构 java

本文链接：https://blog.csdn.net/m0_69745415/article/details/124664887

版权

本文探讨了Kafka如何实现高性能，包括顺序写磁盘减少随机操作，利用Page Cache提升I/O性能，以及通过零拷贝优化网络传输。Kafka通过Partition设计、删除数据的Segment策略、使用LSM存储结构，以及高效利用Page Cache和sendfile系统调用来确保高吞吐量。

摘要由CSDN通过智能技术生成

将写磁盘的过程变为顺序写

Kafka的整个设计中，Partition相当于一个非常长的数组，而Broker接收到的所有消息顺序写入这个大数组中。同时Consumer通过Offset顺序消费这些数据，并且不删除已经消费的数据，从而避免了随机写磁盘的过程。

由于磁盘有限，不可能保存所有数据，实际上作为消息系统Kafka也没必要保存所有数据，需要删除旧的数据。而这个删除过程，并非通过使用“读-写”模式去修改文件，而是将Partition分为多个Segment，每个Segment对应一个物理文件，通过删除整个文件的方式去删除Partition内的数据。这种方式清除旧数据的方式， 《一线大厂Java面试题解析+后端开发学习笔记+最新架构讲解视频+实战项目源码讲义》无偿开源威信搜索公众号【编程进阶路】 也避免了对文件的随机写操作。

在存储机制上，使用了Log Structured Merge Trees(LSM) 。

注：Log Structured Merge Trees(LSM)，谷歌 “BigTable” 的论文，中提出，LSM是当前被用在许多产品的文件结构策略：HBase, Cassandra, LevelDB, SQLite,Kafka。LSM被设计来提供比传统的B+树或者ISAM更好的写操作吞吐量，通过消去随机的本地更新操作来达到这个目标。这个问题的本质还是磁盘随机操作慢，顺序读写快。这二种操作存在巨大的差距，无论是磁盘还是SSD，而且快至少三个数量级。

充分利用Page Cache

Page Cache，其中文名称为页高速缓冲存储器，简称页高缓。page cache的大小为一页&

最低0.47元/天解锁文章

明斯克开源

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Kafka是如何实现高性能的

将写磁盘的过程变为顺序写Kafka的整个设计中，Partition相当于一个非常长的数组，而Broker接收到的所有消息顺序写入这个大数组中。同时Consumer通过Offset顺序消费这些数据，并且不删除已经消费的数据，从而避免了随机写磁盘的过程。由于磁盘有限，不可能保存所有数据，实际上作为消息系统Kafka也没必要保存所有数据，需要删除旧的数据。而这个删除过程，并非通过使用“读-写”模式去修改文件，而是将Partition分为多个Segment，每个Segment对应一个物理文件，通过删除整个文件的
复制链接

扫一扫