Kafka 生产者压缩算法有哪些？

最新推荐文章于 2025-09-01 18:35:45 发布

Shockang

最新推荐文章于 2025-09-01 18:35:45 发布

阅读量2k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：大数据技术体系文章标签： kafka 压缩算法

本文链接：https://blog.csdn.net/Shockang/article/details/124892302

大数据技术体系专栏收录该内容

285 篇文章

订阅专栏

本文探讨了Kafka压缩算法的选择策略，重点比较了GZIP、Snappy、LZ4和zstd在压缩比和吞吐量上的性能，并提供了如何在Kafka中启用gzip压缩的示例。了解了压缩算法的优缺点后，有助于提升I/O密集应用的性能和资源利用效率。

前言

本文隶属于专栏《大数据技术体系》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！

本专栏目录结构和参考文献请见大数据技术体系

关联

数据压缩算法该如何选择？

WHY 压缩？

数据压缩显著地降低了磁盘占用或带宽占用，从而有效地提升了 I/O 密集型应用的性能。

不过引入压缩同时会消耗额外的 CPU 时钟周期，因此压缩是 I/O 性能和 CPU 资源的平衡。

producer 压缩，broker 压缩，consumer 解压

Kafka 自 0.7.x 版本便开始支持压缩特性，producer 端能够将一批消息压缩成一条消息发送，而 broker 端将这条压缩消息写入本地日志文件。

当 consumer 获取到这条压缩消息时，它会自动地对消息进行解压缩，还原成初始的消息集合返还给用户。

如果使用一句话来总结 Kafka 压缩特性的话，那么就是一producer 压缩，broker 压缩，consumer 解压。

所谓的 broker 端保持是指 broker 端在通常情况下不会进行解压缩操作，它只是原样保存消息而已。

这里的“通常情况下”表示要满足一定的条件。

如果有些前置条件不满足（比如需要进行消息格式的转换等)，那么 broker 端就需要对消息进行解压缩然后再重新压缩。

Kafka支持的压缩算法

在 Kafka 2.1.0 版本之前，Kafka 支持 3 种压缩算法：GZIP、Snappy 和 LZ4。

从 2.1.0 开始，Kafka 正式支持 Zstandard 算法（简写为 zstd）。它是 Facebook 开源的一个压缩算法，能够提供超高的压缩比（compression ratio）。

compression.type

指定给定主题的最终压缩类型。

此配置接受标准压缩编解码器（gzip、snappy、lz4、zstd）。

它还接受uncompressed，这相当于没有压缩；

和producer，即保留 producer 设置的原始压缩编解码器。

类型：字符串
默认值： producer
重要性：高
更新模式：集群范围

假定要设置使用 gzip 压缩算法，则设置方法如下：

 Properties props = new Properties();
 props.put("bootstrap.servers", "localhost:9092");
 props.put("acks", "all");
 props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
 props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
 // 开启GZIP压缩
 props.put("compression.type", "gzip");
 
 Producer<String, String> producer = new KafkaProducer<>(props);