Kafka调优

最新推荐文章于 2024-12-17 17:33:55 发布

魔都大迪奥

最新推荐文章于 2024-12-17 17:33:55 发布

阅读量989

点赞数 1

分类专栏：大数据 Kafka

本文链接：https://blog.csdn.net/C_Xiang_Falcon/article/details/101049206

版权

大数据同时被 2 个专栏收录

17 篇文章

订阅专栏

Kafka

10 篇文章

订阅专栏

本文详细介绍Kafka的性能调优策略，包括Swap机制、脏文件处理、网络配置、线程配置、日志策略、复制配置及JVM调优等关键参数的优化，帮助提升Kafka集群的稳定性和吞吐量。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Swap机制

当物理内存使用达到一定的比例后，Linux就会使用进行swap，使用磁盘作为虚拟内存。
通过

cat /proc/sys/vm/swappiness

可以看到swap参数。

这个参数表示虚拟内存中swap磁盘占了多少百分比。
0表示最大限度的使用内存，100表示尽量使用swap磁盘。

调整vm.swappiness以避免不需要的磁盘I / O.

简单设置

$ sudo sysctl -w vm.swappiness = 0

持久设置

可以在/etc/sysctl.conf中设置它，方法是附加“vm.swappiness = 0”并运行“sudo sysctl -p”来重新加载值

脏文件

当大量的持续不断的数据写入cache内存中后，这些数据就被称为脏数据。需要尽快将这些脏数据flush到磁盘中，释放内存。

关于脏文件的两个参数

vm.dirty_background_ratio:这个参数指定了当文件系统缓存脏页数量达到系统内存百分之多少时（如5%）就会触发pdflush/flush/kdmflush等后台回写进程运行，将一定缓存的脏页异步地刷入外存；

vm.dirty_ratio:这个参数则指定了当文件系统缓存脏页数量达到系统内存百分之多少时（如10%），系统不得不开始处理缓存脏页（因为此时脏页数量已经比较多，为了避免数据丢失需要将一定脏页刷入外存）；在此过程中很多应用进程可能会因为系统转而处理文件IO而阻塞。

网络

kafka集群对网络的要求比较高，可以将socket的缓冲设置为原来的两倍。

net.core.wmem_default 设置为128K
net.core.rmem_default 设置为128K

网络和ios操作线程配置优化

    # broker处理消息的最大线程数
    num.network.threads=9
    # broker处理磁盘IO的线程数
    num.io.threads=16

Kafka配置

log数据文件刷盘策略

# 每当producer写入10000条消息时，刷数据到磁盘
log.flush.interval.messages=10000
# 每间隔1秒钟时间，刷数据到磁盘
log.flush.interval.ms=1000

日志保留策略配置

# 日志保留时长
log.retention.hours=72
# 段文件配置
log.segment.bytes=1073741824

replica复制配置

num.replica.fetchers=3
replica.fetch.min.bytes=1
replica.fetch.max.bytes=5242880

分区数量配置

num.partitions=5

JVM虚拟机

GC调优

推荐使用1.7出来的G1垃圾回收机制代替CMS。

与CMS比较

G1在压缩空间方面有优势
G1通过将内存空间分成区域（Region）的方式避免内存碎片问题
Eden, Survivor, Old区不再固定、在内存使用效率上来说更灵活
G1可以通过设置预期停顿时间（Pause Time）来控制垃圾收集时间避免应用雪崩现象
G1在回收内存后会马上同时做合并空闲内存的工作、而CMS默认是在STW（stop the world）的时候做
G1会在Young GC中使用、而CMS只能在O区使用

G1适合的场景

服务端多核CPU、JVM内存占用较大的应用（至少大于4G）
应用在运行过程中会产生大量内存碎片、需要经常压缩空间
想要更可控、可预期的GC停顿周期；防止高并发下应用雪崩现象

我们的kafka的kafka-run-class.sh 中已经包含了

KAFKA_JVM_PERFORMANCE_OPTS="-server -XX:+UseG1GC -XX:MaxGCPauseMillis=20 -XX:InitiatingHeapOccupancyPercent=35 -XX:+DisableExplicitGC -Djava.awt.headless=true"

所以只需要修改kafka-server-start.sh。这里面将内存设置为16G，因为当前kafka的堆内存使用了800多M，1个G的内存不够用。但是分配太多，也没什么用，还容易影响到pagecache，降低效率：

export KAFKA_HEAP_OPTS="-Xms16g -Xmx16g"

Kafka调优

Kafka调优

Swap机制

调整vm.swappiness以避免不需要的磁盘I / O.

简单设置

持久设置

推荐设置

脏文件

关于脏文件的两个参数

推荐设置

网络

网络和ios操作线程配置优化

推荐配置

Kafka配置

log数据文件刷盘策略

推荐配置

日志保留策略配置

推荐配置

replica复制配置

推荐配置

拉取线程数(num.replica.fetchers):

最小字节数(replica.fetch.min.bytes):

最大字节数(replica.fetch.max.bytes)：

最大等待时间(replica.fetch.wait.max.ms):

分区数量配置

推荐配置

JVM虚拟机

GC调优

与CMS比较

G1适合的场景

推荐配置