这8张图带你彻底了解Kafka的最核心机制

前言

kafka是目前企业中很常用的消息队列产品,可以用于削峰、解耦、异步通信。特别是在大数据领域中应用尤为广泛,主要得益于它的高吞吐量、低延迟,在我们公司的解决方案中也有用到。既然kafka在企业中如此重要,那么本文就通过几张图带大家全面认识一下kafka,现在我们不妨带入kafka设计者的角度去思考该如何设计,它的架构是怎么样的、都有哪些组件组成、如何进行扩展等等。

kafka基础架构

现在假如有100T大小的消息要发送到kafka中,数据量非常大,一台机器存储不下,面对这种情况,你该如何设计呢?

很简单,分而治之,一台不够,那就多台,这就形成了一个kafka集群。如下图所示,一个broker就是一个kafka节点,100T数据就有3个节点分担,每个节点约33T,这样就能解决问题了,还能提高吞吐量。

  1. Topic: 可以理解为一个队列,一个kafka集群中可以定义很多的topic,比如上图中的topicA
  2. Partition: 为了实现扩展性,提高吞吐量,一个非常大的 topic 可以分布到多个 broker(即服务器)上,一个 topic 可以分为多个 partition,每个 partition 是一个有序的队列。比如上图中的topicA被分成了3个partition
  3. Replica: 副本,如果数据只放在一个broker中,万一这个broker宕机了怎么办?为了实现高可用,一个 topic 的每个分区都有若干个副本,一个 Leader 和若干个Follower。比如上图中的虚线连接的就是它的副本。
  4. Leader: 每个分区多个副本的“主”,生产者发送数据的对象,以及消费者消费数据的对象都是 Leader
  5. Follower: 每个分区多个副本中的“从”,实时从 Leader 中同步数据,保持和Leader 数据的同步。Leader 发生故障时,某个 Follower 会成为新的 Leader
  6. Producer: 消息生产者,就是向 Kafka broker发消息的客户端,后面详细讲解。
  7. Consumer: 消息消费者,向 Kafka broker 取消息的客户端,多个Consumer会组成一个消费者组,后面详细讲解。
  8. Zookeeper:用来记录kafka中的一些元数据,比如kafka集群中的broker,leader是谁等等,但Kafka2.8.0版本以后也支持非zk的方式,大大减少了和zk的交互。

kafka生产者流程

前面通过一张

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值