Kafka消息队列大数据实战教程-第三篇(Kafka分区和副本的创建)

本文介绍了Kafka中分区和副本的作用,包括存储和计算角度的考虑。详细讲解了分区创建的三种规则,自定义分区策略,以及生产者提高吞吐量的方法。同时探讨了副本的重要性,分区个数选择的考量因素,强调了合理配置对系统性能和数据可靠性的关键影响。
摘要由CSDN通过智能技术生成

前言

重点:分区机制是kafka实现高吞吐的秘密武器

本篇我们就来了解一下怎么合理的配置分区和副本,是我们使用Kafka的关键。

一、为什么要使用分区呢?

1.1 存储角度

便于合理的使用存储资源,实现负载均衡的效果(将海量的数据按照分区切块存储在不同的Broker上面)。

1.2 计算角度

提高并行度,生产者可以按照分区为单位发送数据,消费者也可以按照分区为单位消费数据。

二、分区的三种规则

2.1 指明partition的情况

如果发送数据时指定了partition,直接将指明的值作为partition值,列如指明了partition=0,则全部数据发送到0号分区。

2.2 没有指明partition但是有消息key的情况

如果发送数据时

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DT辰白

你的鼓励是我创作的源泉

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值