Kafka基础架构分析、集群策略及zookeeper定位

最新推荐文章于 2024-06-21 17:34:01 发布

邋遢-大王

最新推荐文章于 2024-06-21 17:34:01 发布

阅读量468

点赞数

分类专栏： Kafka 文章标签： java scala 后端 kafka

本文链接：https://blog.csdn.net/u014439693/article/details/114136618

版权

这节课我主要对kafka的基础架构进行分析,详细讲解架构中涉及的概念与理论

1.kafka基础架构分析

Kafka起初是由LinkedIn公司采用Scala语言开发的一个多分区、多副本且基于ZooKeeper协调的分布式消息系统.

Producer:生产者，也就是发送消息的一方。生产者负责创建消息，然后将其投递到Kafka中
Consumer:消费者，也就是接收消息的一方。消费者连接到Kafka上并接收消息，进而进行相应的业务逻辑处理

Broker:大多数情况下也可以将Broker看作一台Kafka服务器即一个运行kafka服务的机器，一个或多个Broker组成了一个Kafka集群

Zookeeper:用于管理broker与consumer的元数据,包括topic的添加,删除,consumer的下线等.

除了上述提到的概念,kafka还有三个重要的概念:主题(topic)、分区(partition)、副本(replication)

topic:Kafka中的消息以主题为单位进行归类，生产者负责将消息发送到特定的主题（发送到Kafka集群中的每一条消息都要指定一个主题），而消费者负责订阅主题并进行消费

partition:topic是逻辑上的概念,一个主题分为多个分区,每个分区只能用于存储消息,分区在存储层面可以看作一个可追加的日志（Log）文件

生产者生产消息写入log,消费者从log中消费消息

每一条消息被发送到broker之前，会根据分区规则选择存储到哪个具体的分区。如果分区规则设定得合理，所有的消息都可以均匀地分配到不同的分区中。如果一个主题只对应一个文件，那么这个文件所在的机器 I/O 将会成为这个主题的性能瓶颈，而分区解决了这个问题。在创建主题的时候可以通过指定的参数来设置分区的个数，当然也可以在主题创建完成之后去修改分区的数量，通过增加分区的数量可以实现水平扩展。

思考题:kafka能实现全局消息的有序性么?如何实现的?

Kafka 为分区引入了多副本（Replica）机制，通过增加副本数量可以提升容灾能力。同一分区的不同副本中保存的是相同的消息（在同一时刻，副本之间并非完全一样），副本之间是“一主多从”的关系，其中leader副本负责处理读写请求，follower副本只负责与leader副本的消息同步。副本处于不同的broker中，当leader副本出现故障时，从follower副本中重新选举新的leader副本对外提供服务。Kafka通过多副本机制实现了故障的自动转移，当Kafka集群中某个broker失效时仍然能保证服务可用。

Producer生产一条消息是如何与Borker进行交互的?

当producer向leader发送数据时，可以通过request.required.acks参数来设置数据可靠性的级别：

1（默认）：这意味着producer在ISR中的leader已成功收到数据并得到确认。如果leader宕机了，则会丢失数据。
0：这意味着producer无需等待来自broker的确认而继续发送下一批消息。这种情况下数据传输效率最高，但是数据可靠性确是最低的。
-1：producer需要等待ISR中的所有follower都确认接收到数据后才算一次发送完成，可靠性最高。但是这样也不能保证数据不丢失，比如当ISR中只有leader时（前面ISR那一节讲到，ISR中的成员由于某些情况会增加也会减少，最少就只剩一个leader），这样就变成了acks=1的情况。

如果要提高数据的可靠性，在设置request.required.acks=-1的同时，也要min.insync.replicas这个参数(可以在broker或者topic层面进行设置)的配合，这样才能发挥最大的功效。min

最低0.47元/天解锁文章

邋遢-大王

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Kafka基础架构分析、集群策略及zookeeper定位

这节课我主要对kafka的基础架构进行分析,详细讲解架构中涉及的概念与理论1.kafka基础架构分析Kafka起初是由LinkedIn公司采用Scala语言开发的一个多分区、多副本且基于ZooKeeper协调的分布式消息系统.Producer:生产者，也就是发送消息的一方。生产者负责创建消息，然后将其投递到Kafka中Consumer:消费者，也就是接收消息的一方。消费者连接到Kafka上并接收消息，进而进行相应的业务逻辑处理Broker:大多数情况下也可以将Broker看作
复制链接

扫一扫