kafka

最新推荐文章于 2022-10-09 14:37:06 发布

情深的媛

最新推荐文章于 2022-10-09 14:37:06 发布

阅读量323

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liu1pan2min3/article/details/83868804

版权

•Kafka是一个分布式发布-订阅消息系统。它最初由LinkedIn公司开发，之后成为Apache项目的一部分。

•Kafka主要特点

(1) 高吞吐量。据了解，Kafka每秒可以生产约25万条消息（50 MB），每秒处理55万条消息（110 MB）。

(2) 持久化。将消息持久化到磁盘，因此可用于批量消费，例如ETL，以及实时应用程序。通过将数据持久化到硬盘以及replication防止数据丢失。

(3) 分布式系统。所有的producer、broker和consumer都会有多个，均为分布式的。

(4) 可扩展性。kafka使用zookeeper来实现动态的集群扩展，不需要更改客户端（producer和consumer）的配置。broker会在 zookeeper注册并保持相关的元数据（topic，partition信息等）更新。而客户端会在zookeeper上注册相关的watcher。

(5) 数据传输效率高。 kafka不在JVM进程内部维护消息Cache，消息直接从文件中读写，完全依赖操作系统在文件系统层面的cache，避免在JVM中管理Cache带来的额外数据结构开销和GC带来的性能代价。基于批量处理和顺序读写的应用模式，最大化利用文件系统的Cache机制和规避文件读写相对内存读写的性能代价。（零拷贝）

Kafka中角色与术语

•Producer

向kafka中发布消息的进程

•Comsumer

从Kafka中订阅消息的进程

•Broker

Kafka集群中每一个kafka服务

•Topic

保存在Kafka中的每一类消息

它们之间的数据流程如右图所示

•Partition

每一个topic可以被分成多个partition(分区)

Kafka集群中维护的partitions如图所示：

•Replication

一个partition可以有多个备份,默认为1，可以分布在不同broker上

•Leader/Follower

每个partition都有一个唯一的leader，所有的读写操作都在leader上完成。

•Offset

每个消息在partition中的位置叫做offset。

•Consumer Group

同一个Consumer Group中的consumers，Kafka将相应Topic中每个消息只发送给其中一个Consumer。

Kafka系统架构

kafka是显式分布式架构，producer、broker（Kafka）和consumer都可以有多个。

Kafka的作用类似于缓存，即活跃的数据和离线处理系统之间的缓存

负载均衡

•负载均衡可以分为两个部分：producer发消息的负载均衡和consumer读消息的负载均衡。

•

•producer有一个到当前所有broker的连接池，当一个消息需要发送时，需要决定发到哪个broker（即partition）。这是由 partitioner实现的，partitioner是由应用程序实现的。

broker和consumer之间利用zookeeper进行负载均衡。所有broker和consumer都会在zookeeper中进行注册，且 zookeeper会保存他们的一些元数据信息。如果某个broker和consumer发生了变化，所有其他的broker和consumer都会得到通知

•Producer将消息发布到指定的Topic中。

•同时Producer也能决定将此消息归属于哪个partition;比如基于"random","round-robin",

"key-hash"方式或者通过其他的一些算法等。

注：如果客户端不指定Patition，也没有指定Key的话，使用自增长的数字取余数的方式实现指定的Partition。这样Kafka将平均的向Partition中生产数据

消费者

•消费者需要获取数据时,向broker发送fetch请求，并告知所要获取消息的offset，随后consumer会得到相应的数据。Consumer端也可以重置offset来重新消费消息。

Kafka集群中对应Topic中的一个分区只能被Consumer Group中一个Consumer

http://www.importnew.com/24973.html

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
kafka

•Kafka是一个分布式发布-订阅消息系统。它最初由LinkedIn公司开发，之后成为Apache项目的一部分。•Kafka主要特点 (1) 高吞吐量。据了解，Kafka每秒可以生产约25万条消息（50 MB），每秒处理55万条消息（110 MB）。 (2) 持久化。将消息持久化到磁盘，因此可用于批量消费，例如ETL，以及实时应用程序。通过将数据持久化到硬盘以及replic...
复制链接

扫一扫

情深的媛 CSDN认证博客专家 CSDN认证企业博客

码龄12年

123: 原创

5万+: 周排名

142万+: 总排名

33万+: 访问

: 等级

4770: 积分

99: 粉丝

116: 获赞

33: 评论

203: 收藏

私信

关注

热门文章

分类专栏

日记
感悟人生
笔记 2篇
网易
输入输出 1篇
栈 2篇
二叉树 3篇
图 1篇
学习方法 8篇
算法设计 5篇
网页 3篇
其他 17篇
Java 4篇
数据库 2篇
java笔记 13篇
日志
shell 11篇
Linux 3篇
maven 4篇
JVM 5篇
java线程 3篇
goova 1篇
技术让我快乐 12篇

最新评论

ORDER BY优化
左顾右: 此时就须要去掉不必要的返回字段，让返回结果长度适应 max_length_for_sort_data 参数的限制。请教一下：max_length_for_sort_data 不是设置排序字段的大小吗去调不要的字段不能让返回结果长度适应 max_length_for_sort_data 参数的限制吧
三种定时任务的比较
weixin_47401511: 我就喜欢你这样有能力的博主
我所理解的高并发
醉梦洛: 这是简洁明了么？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。