Kafka 作为消息队列中的中坚力量,基本上是每次面试必问的知识点。而说到 Kafka,大家对它的印象就是快!异常地快!
因此,为什么 Kafka 这么快,也是每次面试必问的知识点。对于混迹 Java 技术圈多年的我来说,Kafka 这么快的特性已经了然于胸。今天,就让我带着大家盘一盘!
Kafka 写入速度非常快,主要得益于其系统架构设计,包括:
- PageCache
- 批量压缩传输
- 顺序、批量写磁盘
- 多 partition 分散存储
PageCache
学过操作系统的同学都知道,内存是易丢失的存储介质,而磁盘则是不容易丢失的存储介质。但内存读写速度快,而磁盘读写速度慢。操作系统为了能提高写磁盘的速度,于是在内存中开辟了一小块,用来作为写入磁盘的缓冲,提高写磁盘的速度,这小块内存叫 PageCache。
Kafka 之所以这么快,其中一个很重要的点就是用了 PageCache。 Kafka broker 写入消息的时候,其实并不是直接写入文件,而是写入系统的 PageCache 内存,后续才有操作系统刷入文件中。通过这种方式,Kafka broker 就不直接写文件,而是直接写内存,这样就非常快速了!
因为有 PageCache 的存在,也有了所谓的刷盘。简单来说,就是同步刷盘,还是异步刷盘。同步刷盘,可以理解成写 PageCache 之后直接写磁盘。
这样的好处是消息不会丢失,但是坏处就是速度慢。异步刷盘则相反,写 PageCache 之后就结束,