java kafka关闭连接池_kafka发送客户端在高并发场景下如何保证不频繁GC的

最新推荐文章于 2022-10-24 10:25:56 发布

橙欲闻

最新推荐文章于 2022-10-24 10:25:56 发布

阅读量342

点赞数

文章标签： java kafka关闭连接池

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31064353/article/details/114536490

版权

本文探讨了Kafka客户端在高并发场景下如何利用缓冲池技术避免频繁GC。通过预先分配内存块并管理batch，Kafka确保在发送消息时减少网络开销和性能影响。在Java实现中，使用BufferPool管理内存，按需分配和回收，降低了创建和销毁的成本，提升了效率。

摘要由CSDN通过智能技术生成

最近看kafka源码，着实被它的客户端缓冲池技术优雅到了。忍不住要写篇文章赞美一下(哈哈)。

注：本文用到的源码来自kafka2.2.2版本。

背景

当我们应用程序调用kafka客户端 producer发送消息的时候，在kafka客户端内部，会把属于同一个topic分区的消息先汇总起来，形成一个batch。真正发往kafka服务器的消息都是以batch为单位的。如下图所示：

这么做的好处显而易见。客户端和服务端通过网络通信，这样批量发送可以减少网络带来的性能开销，提高吞吐量。

这个Batch的管理就非常值得探讨了。可能有人会说，这不简单吗？用的时候分配一个块内存，发送完了释放不就行了吗。

kafka是用java语言编写的(新版本大部分都是用java实现的了)，用上面的方案就是使用的时候new一个空间然后赋值给一个引用，释放的时候把引用置为null等JVM GC处理就可以了。

看起来似乎也没啥问题。但是在并发量比较高的时候就会频繁的进行GC。我们都知道GC的时候有个stop the world，尽管最新的GC技术这个时间已经非常短，依然有可能成为生产环境的性能瓶颈。

kafka的设计者当然能考虑到这一层。下面我们就来学习下kafka是如何对batch进行管理的。

缓冲池技术原理解析

kafka客户端使用了缓冲池的概念，预先分配好真实的内存块，放在池子里。

每个ba

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。