kafka分区与分组原理_kafka 基本原理和概念

最新推荐文章于 2023-02-22 15:36:07 发布

weixin_40003780

最新推荐文章于 2023-02-22 15:36:07 发布

阅读量513

点赞数

文章标签： kafka分区与分组原理

本文链接：https://blog.csdn.net/weixin_40003780/article/details/111784762

版权

Kafka系统的角色Broker ：一台kafka服务器就是一个broker。一个集群由多个broker组成。一个broker可以容纳多个topic

topic：可以理解为一个MQ消息队列的名字

Partition：为了实现扩展性，一个非常大的topic可以分布到多个 broker(即服务器)上，一个topic可以分为多个partition，每个partition是一个有序的队列。partition中的每条消息都会被分配一个有序的id(offset)。kafka只保证按一个partition中的顺序将消息发给consumer，不保证一个topic的整体 (多个partition间)的顺序。也就是说，一个topic在集群中可以有多个partition，那么分区的策略是什么？(消息发送到哪个分区上，有两种基本的策略，一是采用Key Hash算法，一是采用Round Robin算法)

ookeeper在Kakfa中扮演的角色Kafka将元数据信息保存在Zookeeper中，但是发送给Topic本身的数据是不会发到Zk上的，否则Zk就疯了。kafka使用zookeeper来实现动态的集群扩展，不需要更改客户端(producer和consumer)的配置。broker会在zookeeper注册并保持相关的元数据(topic，partition信息等)更新。

而客户端会在zookeeper上注册相关的watcher。一旦zookeeper发生变化，客户端能及时感知并作出相应调整。这样就保证了添加或去除broker时，各broker间仍能自动实现负载均衡。这里的客户端指的是Kafka的消息生产端(Producer)和消息消费端(Consumer)Broker端使用zookeeper来注册broker信息,以及监测partition leader存活性.

Consumer端使用zookeeper用来注册consumer信息,其中包括consumer消费的partition列表等,同时也用来发现broker列表,并和partition leader建立socket连接,并获取消息.

Zookeer和Producer没有建立关系，只和Brokers、Consumers建立关系以实现负载均衡，即同一个Consumer Group中的Consumers可以实现负载均衡

入门

1、简介

Kafka is a distributed,partitioned,replicated commit logservice。它提供了类似于JMS的特性，但是在设计实现上完全不同，此外它并不是JMS规范的实现。kafka对消息保存时根据Topic进行归类，发送消息者成为Producer,消息接受者成为Consumer,此外kafka集群有多个kafka实例组成，每个实例(server)成为broker。无论是kafka集群，还是producer和consumer都依赖于zookeeper来保证系统可用性集群保存一些meta信息。

2、Topics/logs

一个Topic可以认为是一类消息，每个topic将被分成多个partition(区),每个partition在存储层面是append log文件。任何发布到此partition的消息都会被直接追加到log文件的尾部，每条消息在文件中的位置称为offset(偏移量)，offset为一个long型数字，它是唯一标记一条消息。它唯一的标记一条消息。kafka并没有提供其他额外的索引机制来存储offset，因为在kafka中几乎不允许对消息进行“随机读写”。

最低0.47元/天解锁文章

weixin_40003780

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
kafka分区与分组原理_kafka 基本原理和概念

Kafka系统的角色Broker ：一台kafka服务器就是一个broker。一个集群由多个broker组成。一个broker可以容纳多个topictopic：可以理解为一个MQ消息队列的名字Partition：为了实现扩展性，一个非常大的topic可以分布到多个 broker(即服务器)上，一个topic可以分为多个partition，每个partition是一个有序的队列。partition...
复制链接

扫一扫