Kafka中的设计-持久化与效率

PangPiLoLo

已于 2024-04-29 10:56:24 修改

阅读量726

点赞数 29

文章标签： kafka 分布式 java 中间件

于 2024-04-29 10:52:59 首次发布

本文链接：https://blog.csdn.net/qq_46863837/article/details/138305098

版权

本文探讨了Kafka如何满足企业级实时数据处理需求，强调其高吞吐量、低延迟、分布式和容错能力。文章深入剖析了Kafka为何选择文件系统存储，以及如何通过优化磁盘访问、批处理和零拷贝技术来提高效率。

摘要由CSDN通过智能技术生成

本篇主要是描述了kafka需要达到的能力以满足广泛的用例，也介绍了kafka的文件系统和持久化原理，最后提到了kafka如如何提高效率的。想要第一时间了解作者编写的文章就快来我的博客吧
PiPi小窝

动机

由于Kafka被设计的能够充当统一平台来处理大公司可能拥有的所有实时数据源，所以要考虑相当广泛的用例，具有以下特定

Kafka是在JVM之上构建的，但是为啥数据不存在JVM中，而是单独使用一个文件系统放在磁盘中呢？

Kafka是依赖文件系统来存储和缓存消息，但是人们普遍认为“磁盘的速度很慢”，这样认为也没错，因为磁盘比人们预期的要慢很多，也快得多——在你使用方式正确的情况下，设计得当的磁盘结构往往可以和网络一样快

磁盘吞吐量和磁盘寻道的延迟存在差异，如果是顺序写入那么速度会非常快，六个 7200rpm SATA RAID-5 阵列的JBOD 配置上
- 线性写入性能约为 600MB/秒
- 随机写入性能约为100k/秒
现代操作系统提供预读和后写技术，以大块倍数预取数据，并将较小的逻辑写入分组为较大的物理写入
- 预读：类似读取数组的某个元素到缓存中时，顺便读这个元素的周围的元素，可以提高缓存命中率
- 后写：合并多个小的写操作为块写入
所以某些情况下，顺序磁盘访问可能比随机内存访问更快
操作系统一般会将主内存给磁盘的数据做缓存
- 并且规定磁盘读写都要经过这个缓存，可以保证缓存的一致性和
- 但是如果应用进程内存也自己设计了缓存，那么有可能会出现内容缓存重复。

了解Java内存的都知道：

对象的内存开销非常高，会使数据大小增加大于一倍，就是因为对象存储的不只是数据还有结构以及其他信息
堆内存的数据越来越多，Java垃圾回收会越来越慢，不管是分代还是分区模型，数据量大起来后整理和清洁都比较繁琐和缓慢

相比于JVM的堆内存和对象，直接使用文件系统的优势

所以Kafka的持久化设计非常简单：所有数据都会立即写入文件系统的吃酒日志，不必刷新到磁盘

消息传递系统中使用的持久数据结构通常是每个消费者的队列，具有关联的 B树或其他通用随机访问数据结构，以维护有关消息的元数据

虽然磁盘访问中B树是一种最通用的数据结构，且支持消息传递系统中的各种事务性和非事务性语义，但是成本却很高
- 虽然操作复杂的为O(logN)被认为是常数时间，但对于磁盘操作来说却不是，因为B树找数据要先找索引以及数据，磁盘就要多次寻道
如果使用简单的读取来进行访问，如同日志记录的解决方案一样，如同数组根据索引或者顺序遍历一样，所有操作都是O(1)的，同样和数组有相同的痛点：占据大量的连续空间和删除元素消耗性能
- 通过批量处理删除操作，减少单个消息删除时的性能开销
- 使用日志段（log segment）来管理消息存储，当日志段满了之后，会进行合并和清理操作，以减少空间占用和提高性能。
所以即使使用寻道性能较差的磁盘，虽然随机读写满，但是顺序读写快、便宜大碗，容量吊打同价格的磁盘
所以即使访问容量无限的磁盘，也不会影响性能，那么我们可以在磁盘容量允许的情况下，将消息保留较长的一段时间后再删除。

由于Kafka最为消息系统，需要应付的就是消费者和生产者，其中生产者的消息生产和消费者的消息消费都是通过Web活动传递

通过Web活动传递，那么就会出现CPU不断地去网卡拉取数据，和推送数据，即使上面提到的磁盘访问模式，解决了一部分读写问题，但是都会涉及到字节复制以及小型I/O操作

小型I/O不仅出现在客户端和服务器之间，也发生在服务器自身的持久化操作中。
优化这种情况Kafka的解决方式是围绕“消息集”抽象构建，也就是将消息分组在一起，统一在一次网络传输中传递
- 生产者一次发送多个消息
- 消费者一次拉取多个消息
这种优化方式被称为“批处理”，导致更大的网络数据包，更大的顺序磁盘操作、连续的内存块等，将随机消息写入的突发流，转换为流向消费者的线性写入

可以发现上述的两个优化方式，都是在优化数据在网络中传输的速度，且小型I/O会增加一次网络传输的数据包大小，且在网络传输中，数据越小肯定接受完成的时间更短

某些情况下，瓶颈实际上不是 CPU 或磁盘，而是网络带宽
可以一次压缩一个消息，而不需要 Kafka 的任何支持，但这可能会导致压缩率非常差
- 因为大部分冗余是由于相同类型的消息之间的重复造成的（例如， JSON 或网络日志中的用户代理或常见字符串值）。
有效的压缩需要将多个消息压缩在一起，而不是单独压缩每个消息。
Kafka 通过高效的批处理格式来支持这一点。一批消息可以聚集在一起压缩并以这种形式发送到服务器。
- 这批消息将以压缩形式写入，并在日志中保持压缩状态，仅由消费者解压缩。
支持 GZIP、Snappy、LZ4 和 ZStandard 压缩协议