Kafka的生产者分区和优化参数


分区的好处 

  1. 便于合理使用存储资源,每个partition在一个Broker上存储,可以把海量的数据按照分区切割成一块一块数据存储在多台Broker上。合理控制分区的任务,可以实现负载均衡的效果。
  2. 提高并行度,生产者可以以分区为单位发送数据;消费者可以以分区为单位消费数据。

Kafka的分区策略

  • 指明partition的情况下,直接将指明的值作为partition值;
    • 例如partition = 0,所有数据写入分区0。
  • 没有指明partition值但有key的情况下,将key的hash值与topic的partition数进行取余得到partition值。
    • key1的hash值=5,key2的hash值=6,topic的partition数=2,那么key1应该被写入1号分区,key2被写入0号分区
  • 既没有partition值有没有key值的情况下,Kafka采用Sticky Partition(粘性分区器),会随机选择一个分区,并尽可能一直使用该分区,待该分区的batch已满或者已完成,Kafka再随机一个分区进行使用(和上一次的分区不同)
    • 第一次选择0号分区,等0号分区当前批次满了(默认16K)或者linger.ms设置的时间到了,Kafka再随机一个分区进行使用(如果还是0会继续随机)

自定义分区器

实现对应的接口,并且在partition方法中书写对应的逻辑,返回值为要发送到的分区号 

同时要对自定义分区器进行注册,key值为自定义分区器的全类名


 参数优化

  1.  压缩可以节省我们的磁盘空间,提升磁盘利用率
  2. 降低IO
  3. 加快数据在磁盘和网络中的传输速度,从而提高系统的处理速度

由于使用数据时,需要先将数据解压,加重CPU负荷

所以如果整个集群cpu利用率非常高,不要开压缩;

若集群负载不高,强烈建议开压缩!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值