num.io.threads=8
一些后台线程数
background.threads = 4
等待IO线程处理的请求队列最大数
queued.max.requests = 500
socket的发送缓冲区(SO_SNDBUF)
socket.send.buffer.bytes=1048576
socket的接收缓冲区 (SO_RCVBUF)
socket.receive.buffer.bytes=1048576
socket请求的最大字节数。为了防止内存溢出,message.max.bytes必然要小于
socket.request.max.bytes = 104857600
############################# Topic #############################
每个topic的分区个数,更多的partition会产生更多的segment file
num.partitions=2
是否允许自动创建topic ,若是false,就需要通过命令创建topic
auto.create.topics.enable =true
一个topic ,默认分区的replication个数 ,不能大于集群中broker的个数。
default.replication.factor =1
消息体的最大大小,单位是字节
message.max.bytes = 1000000
############################# ZooKeeper #############################
Zookeeper quorum设置。如果有多个使用逗号分割
zookeeper.connect=debugo01:2181,debugo02,debugo03
连接zk的超时时间
zookeeper.connection.timeout.ms=1000000
ZooKeeper集群中leader和follower之间的同步实际
zookeeper.sync.time.ms = 2000
############################# Log #############################
#日志存放目录,多个目录使用逗号分割
log.dirs=/var/log/kafka
当达到下面的消息数量时,会将数据flush到日志文件中。默认10000
#log.flush.interval.messages=10000
当达到下面的时间(ms)时,执行一次强制的flush操作。interval.ms和interval.messages无论哪个达到,都会flush。默认3000ms
#log.flush.interval.ms=1000
检查是否需要将日志flush的时间间隔
log.flush.scheduler.interval.ms = 3000
日志清理策略(delete|compact)
log.cleanup.policy = delete
日志保存时间 (hours|minutes),默认为7天(168小时)。超过这个时间会根据policy处理数据。bytes和minutes无论哪个先达到都会触发。
log.retention.hours=168
日志数据存储的最大字节数。超过这个时间会根据policy处理数据。
#log.retention.bytes=1073741824
控制日志segment文件的大小,超出该大小则追加到一个新的日志segment文件中(-1表示没有限制)
log.segment.bytes=536870912
当达到下面时间,会强制新建一个segment
log.roll.hours = 24*7
日志片段文件的检查周期,查看它们是否达到了删除策略的设置(log.retention.hours或log.retention.bytes)
log.retention.check.interval.ms=60000
是否开启压缩
log.cleaner.enable=false
对于压缩的日志保留的最长时间
log.cleaner.delete.retention.ms = 1 day
对于segment日志的索引文件大小限制
log.index.size.max.bytes = 10 * 1024 * 1024
#y索引计算的一个缓冲区,一般不需要设置。
log.index.interval.bytes = 4096
############################# replica #############################
partition management controller 与replicas之间通讯的超时时间
controller.socket.timeout.ms = 30000
controller-to-broker-channels消息队列的尺寸大小
controller.message.queue.size=10
replicas响应leader的最长等待时间,若是超过这个时间,就将replicas排除在管理之外
replica.lag.time.max.ms = 10000
是否允许控制器关闭broker ,若是设置为true,会关闭所有在这个broker上的leader,并转移到其他broker
controlled.shutdown.enable = false
控制器关闭的尝试次数
controlled.shutdown.max.retries = 3
每次关闭尝试的时间间隔
controlled.shutdown.retry.backoff.ms = 5000
如果relicas落后太多,将会认为此partition relicas已经失效。而一般情况下,因为网络延迟等原因,总会导致replicas中消息同步滞后。如果消息严重滞后,leader将认为此relicas网络延迟较大或者消息吞吐能力有限。在broker数量较少,或者网络不足的环境中,建议提高此值.
replica.lag.max.messages = 4000
#leader与relicas的socket超时时间
replica.socket.timeout.ms= 30 * 1000
leader复制的socket缓存大小
replica.socket.receive.buffer.bytes=64 * 1024
replicas每次获取数据的最大字节数
replica.fetch.max.bytes = 1024 * 1024
replicas同leader之间通信的最大等待时间,失败了会重试
replica.fetch.wait.max.ms = 500
每一个fetch操作的最小数据尺寸,如果leader中尚未同步的数据不足此值,将会等待直到数据达到这个大小
replica.fetch.min.bytes =1
leader中进行复制的线程数,增大这个数值会增加relipca的IO
num.replica.fetchers = 1
每个replica将最高水位进行flush的时间间隔
replica.high.watermark.checkpoint.interval.ms = 5000
是否自动平衡broker之间的分配策略
auto.leader.rebalance.enable = false
leader的不平衡比例,若是超过这个数值,会对分区进行重新的平衡
leader.imbalance.per.broker.percentage = 10
检查leader是否不平衡的时间间隔
leader.imbalance.check.interval.seconds = 300
客户端保留offset信息的最大空间大小
offset.metadata.max.bytes = 1024
#############################Consumer #############################
Consumer端核心的配置是group.id、zookeeper.connect
决定该Consumer归属的唯一组ID,By setting the same group id multiple processes indicate that they are all part of the same consumer group.
group.id
消费者的ID,若是没有设置的话,会自增
consumer.id
一个用于跟踪调查的ID ,最好同group.id相同
client.id = <group_id>
对于zookeeper集群的指定,必须和broker使用同样的zk配置
zookeeper.connect=debugo01:2182,debugo02:2182,debugo03:2182
zookeeper的心跳超时时间,查过这个时间就认为是无效的消费者
zookeeper.session.timeout.ms = 6000
zookeeper的等待连接时间
zookeeper.connection.timeout.ms = 6000
zookeeper的follower同leader的同步时间
zookeeper.sync.time.ms = 2000
当zookeeper中没有初始的offset时,或者超出offset上限时的处理方式 。
smallest :重置为最小值
largest:重置为最大值
anything else:抛出异常给consumer
auto.offset.reset = largest
socket的超时时间,实际的超时时间为max.fetch.wait + socket.timeout.ms.
socket.timeout.ms= 30 * 1000
socket的接收缓存空间大小
socket.receive.buffer.bytes=64 * 1024
#从每个分区fetch的消息大小限制
fetch.message.max.bytes = 1024 * 1024
true时,Consumer会在消费消息后将offset同步到zookeeper,这样当Consumer失败后,新的consumer就能从zookeeper获取最新的offset
auto.commit.enable = true
自动提交的时间间隔
auto.commit.interval.ms = 60 * 1000
用于消费的最大数量的消息块缓冲大小,每个块可以等同于fetch.message.max.bytes中数值
queued.max.message.chunks = 10
当有新的consumer加入到group时,将尝试reblance,将partitions的消费端迁移到新的consumer中, 该设置是尝试的次数
rebalance.max.retries = 4
每次reblance的时间间隔
rebalance.backoff.ms = 2000
每次重新选举leader的时间
refresh.leader.backoff.ms
server发送到消费端的最小数据,若是不满足这个数值则会等待直到满足指定大小。默认为1表示立即接收。
fetch.min.bytes = 1
若是不满足fetch.min.bytes时,等待消费端请求的最长等待时间
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Python开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以添加V获取:vip1024c (备注Python)
最后
不知道你们用的什么环境,我一般都是用的Python3.6环境和pycharm解释器,没有软件,或者没有资料,没人解答问题,都可以免费领取(包括今天的代码),过几天我还会做个视频教程出来,有需要也可以领取~
给大家准备的学习资料包括但不限于:
Python 环境、pycharm编辑器/永久激活/翻译插件
python 零基础视频教程
Python 界面开发实战教程
Python 爬虫实战教程
Python 数据分析实战教程
python 游戏开发实战教程
Python 电子书100本
Python 学习路线规划
一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
mg-blog.csdnimg.cn/d29631674929476f9c3b30f7ff58dff0.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2ZlaTM0Nzc5NTc5MA==,size_16,color_FFFFFF,t_70)
一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
[外链图片转存中…(img-7U9sUzwe-1712837616944)]