Kafka server

最新推荐文章于 2024-07-02 14:47:58 发布

Java后时代

最新推荐文章于 2024-07-02 14:47:58 发布

阅读量598

点赞数 14

分类专栏： 2024年程序员学习文章标签： kafka 分布式

本文链接：https://blog.csdn.net/m0_61068088/article/details/137651538

版权

2024年程序员学习专栏收录该内容

291 篇文章 1 订阅

订阅专栏

num.io.threads=8

一些后台线程数

background.threads = 4

等待IO线程处理的请求队列最大数

queued.max.requests = 500

socket的发送缓冲区（SO_SNDBUF）

socket.send.buffer.bytes=1048576

socket的接收缓冲区 (SO_RCVBUF)

socket.receive.buffer.bytes=1048576

socket请求的最大字节数。为了防止内存溢出，message.max.bytes必然要小于

socket.request.max.bytes = 104857600

############################# Topic #############################

每个topic的分区个数，更多的partition会产生更多的segment file

num.partitions=2

是否允许自动创建topic ，若是false，就需要通过命令创建topic

auto.create.topics.enable =true

一个topic ，默认分区的replication个数，不能大于集群中broker的个数。

default.replication.factor =1

消息体的最大大小，单位是字节

message.max.bytes = 1000000

############################# ZooKeeper #############################

Zookeeper quorum设置。如果有多个使用逗号分割

zookeeper.connect=debugo01:2181,debugo02,debugo03

连接zk的超时时间

zookeeper.connection.timeout.ms=1000000

ZooKeeper集群中leader和follower之间的同步实际

zookeeper.sync.time.ms = 2000

############################# Log #############################

log.dirs=/var/log/kafka

当达到下面的消息数量时，会将数据flush到日志文件中。默认10000

#log.flush.interval.messages=10000

当达到下面的时间(ms)时，执行一次强制的flush操作。interval.ms和interval.messages无论哪个达到，都会flush。默认3000ms

#log.flush.interval.ms=1000

检查是否需要将日志flush的时间间隔

log.flush.scheduler.interval.ms = 3000

日志清理策略（delete|compact）

log.cleanup.policy = delete

日志保存时间 (hours|minutes)，默认为7天（168小时）。超过这个时间会根据policy处理数据。bytes和minutes无论哪个先达到都会触发。

log.retention.hours=168

日志数据存储的最大字节数。超过这个时间会根据policy处理数据。

#log.retention.bytes=1073741824

控制日志segment文件的大小，超出该大小则追加到一个新的日志segment文件中（-1表示没有限制）

log.segment.bytes=536870912

当达到下面时间，会强制新建一个segment

log.roll.hours = 24*7

日志片段文件的检查周期，查看它们是否达到了删除策略的设置（log.retention.hours或log.retention.bytes）

log.retention.check.interval.ms=60000

是否开启压缩

log.cleaner.enable=false

对于压缩的日志保留的最长时间

log.cleaner.delete.retention.ms = 1 day

对于segment日志的索引文件大小限制

log.index.size.max.bytes = 10 * 1024 * 1024

#y索引计算的一个缓冲区，一般不需要设置。

log.index.interval.bytes = 4096

############################# replica #############################

partition management controller 与replicas之间通讯的超时时间

controller.socket.timeout.ms = 30000

controller-to-broker-channels消息队列的尺寸大小

controller.message.queue.size=10

replicas响应leader的最长等待时间，若是超过这个时间，就将replicas排除在管理之外

replica.lag.time.max.ms = 10000

是否允许控制器关闭broker ,若是设置为true,会关闭所有在这个broker上的leader，并转移到其他broker

controlled.shutdown.enable = false

控制器关闭的尝试次数

controlled.shutdown.max.retries = 3

每次关闭尝试的时间间隔

controlled.shutdown.retry.backoff.ms = 5000

如果relicas落后太多,将会认为此partition relicas已经失效。而一般情况下,因为网络延迟等原因,总会导致replicas中消息同步滞后。如果消息严重滞后,leader将认为此relicas网络延迟较大或者消息吞吐能力有限。在broker数量较少,或者网络不足的环境中,建议提高此值.

replica.lag.max.messages = 4000

#leader与relicas的socket超时时间

replica.socket.timeout.ms= 30 * 1000

leader复制的socket缓存大小

replica.socket.receive.buffer.bytes=64 * 1024

replicas每次获取数据的最大字节数

replica.fetch.max.bytes = 1024 * 1024

replicas同leader之间通信的最大等待时间，失败了会重试

replica.fetch.wait.max.ms = 500

每一个fetch操作的最小数据尺寸,如果leader中尚未同步的数据不足此值,将会等待直到数据达到这个大小

replica.fetch.min.bytes =1

leader中进行复制的线程数，增大这个数值会增加relipca的IO

num.replica.fetchers = 1

每个replica将最高水位进行flush的时间间隔

replica.high.watermark.checkpoint.interval.ms = 5000

是否自动平衡broker之间的分配策略

auto.leader.rebalance.enable = false

leader的不平衡比例，若是超过这个数值，会对分区进行重新的平衡

leader.imbalance.per.broker.percentage = 10

检查leader是否不平衡的时间间隔

leader.imbalance.check.interval.seconds = 300

客户端保留offset信息的最大空间大小

offset.metadata.max.bytes = 1024

#############################Consumer #############################

Consumer端核心的配置是group.id、zookeeper.connect

决定该Consumer归属的唯一组ID，By setting the same group id multiple processes indicate that they are all part of the same consumer group.

group.id

消费者的ID，若是没有设置的话，会自增

consumer.id

一个用于跟踪调查的ID ，最好同group.id相同

client.id = <group_id>

对于zookeeper集群的指定，必须和broker使用同样的zk配置

zookeeper.connect=debugo01:2182,debugo02:2182,debugo03:2182

zookeeper的心跳超时时间，查过这个时间就认为是无效的消费者

zookeeper.session.timeout.ms = 6000

zookeeper的等待连接时间

zookeeper.connection.timeout.ms = 6000

zookeeper的follower同leader的同步时间

zookeeper.sync.time.ms = 2000

当zookeeper中没有初始的offset时，或者超出offset上限时的处理方式。

smallest ：重置为最小值

largest:重置为最大值

anything else：抛出异常给consumer

auto.offset.reset = largest

socket的超时时间，实际的超时时间为max.fetch.wait + socket.timeout.ms.

socket.timeout.ms= 30 * 1000

socket的接收缓存空间大小

socket.receive.buffer.bytes=64 * 1024

#从每个分区fetch的消息大小限制

fetch.message.max.bytes = 1024 * 1024

true时，Consumer会在消费消息后将offset同步到zookeeper，这样当Consumer失败后，新的consumer就能从zookeeper获取最新的offset

auto.commit.enable = true

自动提交的时间间隔

auto.commit.interval.ms = 60 * 1000

用于消费的最大数量的消息块缓冲大小，每个块可以等同于fetch.message.max.bytes中数值

queued.max.message.chunks = 10

当有新的consumer加入到group时,将尝试reblance,将partitions的消费端迁移到新的consumer中, 该设置是尝试的次数

rebalance.max.retries = 4

每次reblance的时间间隔

rebalance.backoff.ms = 2000

每次重新选举leader的时间

refresh.leader.backoff.ms

server发送到消费端的最小数据，若是不满足这个数值则会等待直到满足指定大小。默认为1表示立即接收。

fetch.min.bytes = 1

若是不满足fetch.min.bytes时，等待消费端请求的最长等待时间

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数Python工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年Python开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上Python开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以添加V获取：vip1024c （备注Python）

最后

不知道你们用的什么环境，我一般都是用的Python3.6环境和pycharm解释器，没有软件，或者没有资料，没人解答问题，都可以免费领取（包括今天的代码），过几天我还会做个视频教程出来，有需要也可以领取~

给大家准备的学习资料包括但不限于：

Python 环境、pycharm编辑器/永久激活/翻译插件

python 零基础视频教程

Python 界面开发实战教程

Python 爬虫实战教程

Python 数据分析实战教程

python 游戏开发实战教程

Python 电子书100本

Python 学习路线规划

一个人可以走的很快，但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎扫码加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

mg-blog.csdnimg.cn/d29631674929476f9c3b30f7ff58dff0.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2ZlaTM0Nzc5NTc5MA==,size_16,color_FFFFFF,t_70)

一个人可以走的很快，但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎扫码加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！
[外链图片转存中…(img-7U9sUzwe-1712837616944)]