Kafka生产者消息分区机制剖析

最新推荐文章于 2024-06-28 15:27:35 发布

AI掘金

最新推荐文章于 2024-06-28 15:27:35 发布

阅读量1.1k

点赞数 1

分类专栏： kafka 文章标签： Kafka生产者消息分区机制剖析 Kafka分区 Kafka分区策略 Kafka分区作用 Kafka分区场景

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36918149/article/details/99618617

版权

本文深入探讨了Kafka生产者消息分区的重要性，包括负载均衡、高伸缩性和顺序消息的需求。详细介绍了轮询、随机和按消息键保序三种分区策略，强调选择合适策略以避免数据倾斜和性能瓶颈。

摘要由CSDN通过智能技术生成

一、为什么要分区？

在使用Apache Kafka 生产和消费消息的时候，肯定是希望能够将数据均匀地分配到所有服务上。比如很多公司使用Kafka收集应用程序的日志数据，这种数据都是很多的，特别是对于大批量集群环境，每分钟产生的日志量达到GB级别，因此如何将这么大的数据量均匀分配到Kafka的各个Broker上，是一个非常重要的问题。

Kafka有主题（Topic）的概念，它是承载真实数据的逻辑容器，而在主体之下还分为若干分区，Kafka 消息组织是三级结构：主题-分区-消息。主题下每条消息都会保存到一个分区中。官网描述三级结果示例图如下：
在这里插入图片描述
Kafka 为什么使用分区的概念而不使用多个主题呢？
其实分区的作用是提供负载均衡的能力，是为了实现系统的高伸缩性（Scalability）。不同的分区能够放置到不同的节点上，而数据的读写操作是针对分区粒度进行的，这样每个节点的机器都能独立执行各个自分区的读写操作。并且，我们还可以通过添加新节点机器来增加整体的吞吐量。

其实分区的概念在分布式系统中非常常见，不同的分布式系统中叫法不尽相同而已。比如，在Kafka中叫分区，在MongoDB 和 Elasticsearch 中就叫分片Shard，在HBase中则叫Region，在Cassandra 中被叫做vnode。

在Kafka 分区除了提供负载均衡这种核心功能外，还能解决供顺序消息等业务需求。

二、有哪些

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

AI掘金 CSDN认证博客专家 CSDN认证企业博客

码龄8年

137: 原创

2万+: 周排名

1万+: 总排名

23万+: 访问

: 等级

3653: 积分

127: 粉丝

224: 获赞

23: 评论

477: 收藏

私信

关注

热门文章

分类专栏

最新评论

Ai知识图谱
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
生产环境 InputStream.available() = 0 导致的一次血案
执笔录今夕: 这样写会有问题吧，直接read会提示java.net.SocketException: Connection reset
Kafka消费者组是什么？
Fredyue2006: 1+2+3 = 6，总共6分区
生产环境 InputStream.available() = 0 导致的一次血案
比特灵: available我在串口、USB、蓝牙等信息通讯时常用，但是偶尔在网络环境下用了一次发现确实不可靠，后修改为： [code=java] int canRead; byte[] buffer = new byte[1024]; try { while ((canRead = is.read(buffer)) != -1) { if (canRead == 0) { Log.d(tag, "读不到数据"); continue; } //Log.d(tag, "大小：" + canRead); outputStream.write(buffer, 0, canRead); } Log.d(tag, "写入完成"); } catch (IOException e) { e.printStackTrace(); } [/code]
生产环境 InputStream.available() = 0 导致的一次血案
function_HY: 楼主，你这样用是不对的，利用is.read();读取之后，流中的数据一定是不完整的，你后面代码读出的数据一定是不完整的

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。