在Kafka上创建一个Topic及apache kafka中topic级别配置

手动创建
./bin/kafka-topics.sh –zookeeper 172.16.8.225:2181/config/mobile/mq –create –topic test.example –replication-factor 2 –partitions 24
–topic指定topic name
–partitions指定分区数,这个参数需要根据broker数和数据量决定,正常情况下,每个broker上两个partition最好;
–replication-factor指定partition的replicas数,建议设置为2;

自动创建:
开启自动创建配置:auto.create.topics.enable=true
使用程序直接往kafka中相应的topic发送数据,如果topic不存在就会按默认配置进行创建。


1.topic级别配置用法
配置topic级别参数时,相同(参数)属性topic级别会覆盖全局的,否则默认为全局配置属性值。
创建topic参数可以设置一个或多个--config "Property(属性)",下面是创建一个topic名称为"my-topic"例子,它设置了2个参数max message size 和 flush rate:

1) 创建topic时配置参数

#/data/kafka_2.10-0.8.1_03# bin/kafka-topics.sh --zookeeper 192.168.2.225:2183/config/mobile/mq/mafka02 --create --topic my-topic --partitions 1   --replication-factor 1 --config max.message.bytes=64000 --config flush.messages=1

2)修改topic时配置参数
覆盖已经有topic参数,下面例子修改"my-topic"的max message属性

#/data/kafka_2.10-0.8.1_03#  bin/kafka-topics.sh --zookeeper192.168.2.225:2183/config/mobile/mq/kafka02  --alter --topic my-topic  --config max.message.bytes=128000

3) 删除topic级别配置参数

#/data/kafka_2.10-0.8.1_03# bin/kafka-topics.sh --zookeeper192.168.2.225:2183/config/mobile/mq/mafka02  --alter --topic my-topic  --deleteConfig max.message.bytes

4)topic级别在zookeeper存储结构
笔者配置的zk kafka集群的根目录为/config/mobile/mq/mafka02,因此所有节点信息都在此目录下。
"my-topic"在zk上路径为xxx/config/topics/my-topic,存储内容如下:
{
    "version": 1,
    "config": {
        "max.message.bytes": "12800000",
        "flush.messages": "1000"
    }
}

2.topic级别配置属性表
以下是topic级别配置, kafak server中默认配置为下表“Server Default Property”列,当需要设置topic级别配置时,属性设置为“Property(属性)”列


Property(属性)Default(默认值)Server Default Property(server.properties)说明(解释)
cleanup.policydeletelog.cleanup.policy日志清理策略选择有:delete和compact主要针对过期数据的处理,或是日志文件达到限制的额度,会被 topic创建时的指定参数覆盖
delete.retention.ms86400000 (24 hours)log.cleaner.delete.retention.ms对于压缩的日志保留的最长时间,也是客户端消费消息的最长时间,同log.retention.minutes的区别在于一个控制未压缩数据,一个控制压缩后的数据。会被topic创建时的指定参数覆盖
flush.messagesNonelog.flush.interval.messageslog文件”sync”到磁盘之前累积的消息条数,因为磁盘IO操作是一个慢操作,但又是一个”数据可靠性"的必要手段,所以此参数的设置,需要在"数据可靠性"与"性能"之间做必要的权衡.如果此值过大,将会导致每次"fsync"的时间较长(IO阻塞),如果此值过小,将会导致"fsync"的次数较多,这也意味着整体的client请求有一定的延迟.物理server故障,将会导致没有fsync的消息丢失.
flush.msNonelog.flush.interval.ms仅仅通过interval来控制消息的磁盘写入时机,是不足的.此参数用于控制"fsync"的时间间隔,如果消息量始终没有达到阀值,但是离上一次磁盘同步的时间间隔达到阀值,也将触发.
index.interval.bytes4096log.index.interval.bytes当执行一个fetch操作后,需要一定的空间来扫描最近的offset大小,设置越大,代表扫描速度越快,但是也更好内存,一般情况下不需要搭理这个参数
message.max.bytes1,000,000message.max.bytes表示消息的最大大小,单位是字节
min.cleanable.dirty.ratio0.5log.cleaner.min.cleanable.ratio日志清理的频率控制,越大意味着更高效的清理,同时会存在一些空间上的浪费,会被topic创建时的指定参数覆盖
retention.bytesNonelog.retention.bytestopic每个分区的最大文件大小,一个topic的大小限制 = 分区数*log.retention.bytes。-1没有大小限log.retention.bytes和log.retention.minutes任意一个达到要求,都会执行删除,会被topic创建时的指定参数覆盖
retention.msNonelog.retention.minutes数据存储的最大时间超过这个时间会根据log.cleanup.policy设置的策略处理数据,也就是消费端能够多久去消费数据
log.retention.bytes和log.retention.minutes达到要求,都会执行删除,会被topic创建时的指定参数覆盖
segment.bytes1 GBlog.segment.bytestopic的分区是以一堆segment文件存储的,这个控制每个segment的大小,会被topic创建时的指定参数覆盖
segment.index.bytes10 MBlog.index.size.max.bytes对于segment日志的索引文件大小限制,会被topic创建时的指定参数覆盖
log.roll.hours7 dayslog.roll.hours这个参数会在日志segment没有达到log.segment.bytes设置的大小,也会强制新建一个segment会被 topic创建时的指定参数覆盖

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值