kafka—2、操作实践

蓝魔Y

已于 2024-04-08 14:53:56 修改

阅读量106

点赞数

分类专栏： kafka 文章标签： kafka

于 2022-08-25 09:24:38 首次发布

原文链接：https://kafka.apache.org/documentation/#quickstart

版权

kafka 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文档结构

1、概念简介
2、核心设计
- 2.1、组件模块
3、代码引用
4、管理工具

1、概念简介

Kafka是一个高吞吐量分布式消息系统，采用Scala和Java语言编写，它提供了快速、可扩展的、分布式、分区的和可复制的日志订阅服务。它由Producer、Broker、Consumer三部分构成。

2、核心设计

2.1、组件模块

1）Producer

消息生产者，是消息的产生的源头，负责生成消息并发送到Kafka服务器上。

2）Consumer

消息消费者，是消息的使用方，负责消费Kafka服务器上的消息。

对于消费者，不是以单独的形式存在的，每一个消费者属于一个 consumer group，一个 group 包含多个 consumer。特别需要注意的是：订阅 Topic 是以一个消费组来订阅的，发送到 Topic 的消息只会被订阅此 Topic 的每个 group 中的一个 consumer 消费。

具体说来是根据 partition 来分的，一个 Partition只能被消费组里的一个消费者消费，但是可以同时被多个消费组消费，消费组里的每个消费者是关联到一个 partition 的。因此对于一个 topic同一个 group 中不能有多于 partitions 个数的 consumer 同时消费，否则将意味着某些 consumer 将无法得到消息。

3）Broker

消息中间件处理结点，一个Kafka节点（server）就是一个broker，多个broker可以组成一个Kafka集群。

Broker不保存订阅者的状态，由订阅者自己保存。Broker没有副本机制，一旦broker宕机，该broker的消息将都不可用。

4.1）Topic

在Kafka中，消息是按Topic组织的。

4.2）Offset

partition中的每个消息都有一个连续的序列号叫做offset，用于partition唯一标识一条消息。
消息存储在Kafka的Broker上，消费者拉取消息数据的过程中需要知道消息在文件中的偏移量，这个偏移量就是所谓的Offset。

5.1）Partition

topic物理上的分组，一个topic可以分为多个partition，每个partition为一个目录；多个分区可以分布到多个Broker上，也可以分布到同一台Broker上；
即一个消费者可以消费多个分区，一个分区只能给一个消费者消费；

Controller：中央控制器Control，负责管理分区和副本状态并执行管理着这些分区的重新分配。（里面涉及到partition leader 选举）
ISR：同步副本组

5.2）Segment

partition物理上由多个segment组成；
每个Partition(目录)由多个大小相等segment(段)数据文件组成，但每个段segment file消息数量不一定相等，这种特性方便old segment file快速被删除。

==================== 其他特性=====================================================================

1）kafka服务器的编号为0起始，number-1结束；
2）消息订阅者可以rewind back到任意位置重新进行消费，当订阅者故障时，可以选择最小的offset(id)进行重新读取消费消息。

3、代码引用

4、管理工具

可视化工具kafka-eagle
下载kafka-eagle的安装包，下载地址：https://github.com/smartloli/kafka-eagle-bin/releases

============================================ over ===========================================

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

蓝魔Y CSDN认证博客专家 CSDN认证企业博客

码龄7年

82: 原创

11万+: 周排名

4万+: 总排名

7万+: 访问

: 等级

781: 积分

45: 粉丝

79: 获赞

5: 评论

177: 收藏

私信

关注

热门文章

分类专栏

Python编程 41篇
数据库 21篇
调度工具
kafka 3篇
大数据 1篇
算法 1篇
操作系统 3篇
Linux 6篇
hadoop 1篇
apache 5篇
Web 开发 4篇
hive
DataX 1篇
flink 1篇
spark 1篇
flume 1篇
Java 编程 8篇

最新评论

Python—12.1、logging模块
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh-cn/latest/articles/c1.html 使用原生 loggng封装，兼容性和替换性100%,只需要一行代码大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
greenplum—监控运维
CSDN-Ada助手: 不知道云原生入门技能树是否可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native
端口代理—Frp工具
2401_82665034: 你好。我想学一点这方面的知识。能不能加个好友。请教一下
linux—多服务免密登录
CSDN-Ada助手: 不知道 CS入门技能树是否可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
linux—多服务免密登录
CSDN-Ada助手: 推荐 CS入门技能树：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。