Kafka
文章平均质量分 84
Erica_1230
这个作者很懒,什么都没留下…
展开
-
Kafka学习之Kafka选举机制简述
Kafka是一个高性能,高容错,多副本,可复制的分布式消息系统。在整个系统中,涉及到多处选举机制,被不少人搞混,这里总结一下,本篇文章大概会从三个方面来讲解。控制器(Broker)选主 分区多副本选主 消费组选主1、控制器(Broker)选举 所谓控制器就是一个Borker,在一个kafka集群中,有多个broker节点,但是它们之间需要选举出一个leader,其他的broker充当follower角色。集群中第一个启动的broker会通过在zookeeper中创建临时节点/cont.转载 2021-04-06 14:04:28 · 342 阅读 · 0 评论 -
Kafka水位(HW)与leader epoch的讨论
Kafka水位(HW)与leader epoch的讨论转载声明:本文系转载自以下两篇文章:Kafka水位(high watermark)与leader epoch的讨论 作者: huxihx转载仅为方便学习查看,一切权利属于原作者,本人只是做了整理和排版,如果带来不便请联系我删除。摘要本文主要讨论0.11版本之前Kafka的副本备份机制的设计问题以及0.11是如何解决的。简单来说,0.11之前副本备份机制主要依赖水位(或水印)的概念,而0.11采用了leader epoch来标识备份转载 2021-04-01 15:23:40 · 296 阅读 · 0 评论 -
Kafka幂等性原理
kafka幂等性Kafka Producer 的幂等性指的是当发送同一条消息时,数据在 Server 端只会被持久化一次,数据不丟不重,但是这里的幂等性是有条件的:只能保证 Producer 在单个会话内不丟不重,如果 Producer 出现意外挂掉再重启是无法保证的(幂等性情况下,是无法获取之前的状态信息,因此是无法做到跨会话级别的不丢不重);幂等性不能跨多个 Topic-Partition,只能保证单个 partition 内的幂等性,当涉及多个 Topic-Partition 时,这中间的状态转载 2021-03-31 16:33:15 · 506 阅读 · 0 评论 -
Kafka高性能读写原理
一、页缓存技术 + 磁盘顺序写首先Kafka每次接收到数据都会往磁盘上去写,如下图所示。那么在这里我们不禁有一个疑问了,如果把数据基于磁盘来存储,频繁的往磁盘文件里写数据,这个性能会不会很差?大家肯定都觉得磁盘写性能是极差的。没错,要是真的跟上面那个图那么简单的话,那确实这个性能是比较差的。但是实际上Kafka在这里有极为优秀和出色的设计,就是为了保证数据写入性能,首先Kafka是基于操作系统的页缓存来实现文件写入的。操作系统本身有一层缓存,叫做page cache,是在内存里的缓.转载 2021-03-12 13:46:44 · 552 阅读 · 0 评论 -
Kafka重平衡
一、什么是 Rebalance分区的所有权从一个消费者转移到另一个消费者,这样的行为被称为重平衡(Rebalance)。Rebalance 实现了消费者群组的高可用性和伸缩性。消费者通过向被指派为群组协调器(Coordinator)的 broker 发送心跳来维持它们和群组的从属关系以及它们对分区的所有权。所谓协调者,在 Kafka 中对应的术语是 Coordinator,它专门为 Consumer Group 服务,负责为 Group 执行 Rebalance 以及提供位移管理和组成员管理等转载 2021-03-12 09:27:59 · 737 阅读 · 0 评论 -
Kafka ISR
ISR(in-sync replica) 就是 Kafka 为某个分区维护的一组同步集合,即每个分区都有自己的一个 ISR 集合,处于 ISR 集合中的副本,意味着 follower 副本与 leader 副本保持同步状态,只有处于 ISR 集合中的副本才有资格被选举为 leader。一条 Kafka 消息,只有被 ISR 中的副本都接收到,才被视为“已同步”状态。这跟 zk 的同步机制不一样,zk 只需要超过半数节点写入,就可被视为已写入成功。follwer 副本与 leader 副本之间的数据同步流转载 2021-03-05 16:30:28 · 1624 阅读 · 0 评论 -
Kafka副本机制ISR
Topic、Partition、Replica是主题层三要素,每个Topic都有至少一个Partition,而Partition有副本机制,Kafka定义了两类副本:领导者副本和追随者副本。只能有 1 个领导者副本和 N-1 个追随者副本。这些都是你死记硬背出来的,因此你会有很多的疑问:为什么kafka要有副本机制? 为什么要有领导者副本和追随者副本两种角色? 领导者副本和追随者副本之间的关系是什么? 当领导者副本挂了的时候,追随者副本会有怎样的操作?今天我们就让它从概念变成你的玩物副.转载 2021-02-14 14:52:08 · 750 阅读 · 1 评论 -
kafka消息检索原理
1、消息结构体构成2、消息检索的原理读取数据的过程中,数据是属于某一个topic的某一个partition对应的某一个segment文件中的某一条记录。如何高效找到这条消息,决定着kafka的性能。Kafka中数据文件的保存目录,我们可以看到的是这个partition下面有好多组文件,每一组都由一个segment数据文件,一个index索引文件,以及一个timeindex时间戳索引文件构成。Segment就是保存数据的文件,index索引文件每一条消息相对偏移量,也就是一条msg在segme转载 2021-02-12 19:40:26 · 472 阅读 · 0 评论 -
Kafka学习总结(一)——Kafka的message存储数据结构
参考资料:https://blog.csdn.net/gongxinju/article/details/72672375以后继续深入总结。Kafka中的Message是以topic为基本单位组织的,不同的topic之间是相互独立的。每个topic又可以分成几个不同的partition(每个topic有几个partition是在创建topic时指定的),每个partition存储一部分Mes...转载 2019-12-11 11:27:23 · 816 阅读 · 0 评论