Kafka为什么要在JVM层次上进行优化?
为了充分利用网络,提高吞吐量,实现高效网络通信。Kafka客户端会将发送给Kafka服务器的消息先放入自身的内存缓冲中,多条消息组成一个Batch,之后通过一次网络通信发送出去,避免了一条消息一次网络请求。
当网络传输完成之后 位于Kafka客户端 也就是JVM内存中的batch已经是不需要了 这时候我们需要JVMGC回收器回收这些内存。
高强度高流量的消息发送过程会触发JVM的多次GC回收,进而影响用户工作线程的运行。
因而,Kafka必须要在JVM层次上采用有效的优化策略。
Kafka如何进行JVM GC优化?
核心思想 池的机制
线程池 避免线程创建销毁的开销
数据库连接池 避免数据库连接创建销毁的开销
Kafka 利用缓冲池来存储 batch中的数据
当batch数据网络传输之后 该内存空间指向缓冲池
需要创建batch 就在缓冲池中拿一个内存块
当缓冲池没有内存块,阻塞写入线程 直至有内存块释放出来