kafka性能调优

最新推荐文章于 2024-07-22 16:17:17 发布

明天你好lk

最新推荐文章于 2024-07-22 16:17:17 发布

阅读量596

点赞数

分类专栏：大数据

本文链接：https://blog.csdn.net/likaiasddsa/article/details/92426392

版权

大数据专栏收录该内容

31 篇文章 1 订阅

订阅专栏

kafka性能调优

1、将一个topic拆分为多个partition可以提高吞吐量。

不同partition需要位于不同的磁盘（可以在同一个机器）。如果多个partition位于同一个磁盘，那么意味着有多个进程同时对一个磁盘的多个文件进行读写，使得操作系统会对磁盘读写进行频繁调度，也就是破坏了磁盘读写的连续性。

同一个ConsumerGroup内的Consumer和Partition在同一时间内必须保证是一对一的消费关系

2、推荐使用最新的G1来代替CMS作为垃圾回收器。

CMS只能使用在Old区，在清理Young时一般是配合使用ParNew，而G1可以统一两类分区的回收算法。

3、broker处理消息的最大线程数配置线程数量为cpu核数加1.

num.network.threads=xxx

4、broker处理磁盘IO的线程数配置线程数量为cpu核数2倍，最大不超过3倍

num.io.threads=xxx

5、log.flush.interval.ms

log数据文件刷盘策略
每当producer写入10000条消息时，刷数据到磁盘 log.flush.interval.messages=10000
每间隔1秒钟时间，刷数据到磁盘
log.flush.interval.ms=1000

6、log.retention.hours

日志保留策略配置
保留三天，也可以更短
log.retention.hours=72

7、log.segment.bytes

段文件配置1GB，有利于快速回收磁盘空间，重启kafka加载也会加快(如果文件过小，则文件数量比较多，
kafka启动时是单线程扫描目录(log.dir)下所有数据文件)
log.segment.bytes=1073741824
replica.lag.time.max.ms:10000
replica.lag.max.messages:4000