Kafka3.0 Broker 高效读写数据

最新推荐文章于 2024-01-16 16:44:56 发布

Alienware^

最新推荐文章于 2024-01-16 16:44:56 发布

阅读量193

点赞数

分类专栏： # Kafka 文章标签： kafka java 分布式

本文链接：https://blog.csdn.net/weixin_45417821/article/details/125123968

版权

Kafka 专栏收录该内容

23 篇文章 4 订阅

订阅专栏

文章目录

1）Kafka 本身是分布式集群，可以采用分区技术，并行度高
2）读数据采用稀疏索引，可以快速定位要消费的数据
3）顺序写磁盘
Kafka 的 producer 生产数据，要写入到 log 文件中，写的过程是一直追加到文件末端，为顺序写。官网有数据表明，同样的磁盘，顺序写能到 600M/s，而随机写只有 100K/s。这与磁盘的机械机构有关，顺序写之所以快，是因为其省去了大量磁头寻址的时间。

在这里插入图片描述
4）页缓存 + 零拷贝技术

零拷贝：Kafka的数据加工处理操作交由Kafka生产者和Kafka消费者处理。Kafka Broker应用层不关心存储的数据，所以就不用走应用层，传输效率高。

PageCache页缓存：Kafka重度依赖底层操作系统提供的PageCache功能。当上层有写操作时，操作系统只是将数据写入PageCache。当读操作发生时，先从PageCache中查找，如果找不到，再去磁盘中读取。实际上PageCache是把尽可能多的空闲内存都当做了磁盘缓存来使用。

在这里插入图片描述

参数	描述
log.flush.interval.messages	强制页缓存刷写到磁盘的条数，默认是 long 的最大值，9223372036854775807。一般不建议修改，交给系统自己管理。
log.flush.interval.ms	每隔多久，刷数据到磁盘，默认是 null。一般不建议修改，交给系统自己管理。

此文也是kafka面试问题之一： kafka为什么这么快？

Alienware^

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Kafka3.0 Broker 高效读写数据

1）Kafka 本身是分布式集群，可以采用分区技术，并行度高2）读数据采用稀疏索引，可以快速定位要消费的数据3）顺序写磁盘Kafka 的 producer 生产数据，要写入到 log 文件中，写的过程是一直追加到文件末端，为顺序写。官网有数据表明，同样的磁盘，顺序写能到 600M/s，而随机写只有 100K/s。这与磁盘的机械机构有关，顺序写之所以快，是因为其省去了大量磁头寻址的时间。4）页缓存 + 零拷贝技术零拷贝：Kafka的数据加工处理操作交由Kafka生产者和Kafka消费者处理。Kafka
复制链接

扫一扫

专栏目录