kafka概述

1、kafka定义
kafka是一个分布式的基于发布/订阅的消息队列,大多数用于大数据处理领域。
2、使用消息队列的好处
(1)解耦:可以独立的扩展两边的处理过程并遵守同样的接口约束;
(2)可恢复性:消息队列降低了进城之间的耦合性,所以即使一个处理消息的进城挂掉之后,加入队列的消息仍然可以被恢复后的进城处理;
(3)缓冲:有效的解决和优化了消息生产者和消费者处理速度不一致的问题;
(4)灵活性:在访问量剧增的情况下,应用仍然需要继续发挥作用,但是这样的突发流量并不常见。如果为以能处理这类峰值访问为标准来投入资源随时待命无疑是巨大的浪费。使用消息队列能够使关键组件顶住突发的访问压力,而不会因为突发的超负荷的请求而完全崩溃。
(5)异步通信:生产者生产消息后可实现异步消费,随时消费都可以。
3、消息队列的两种模式:
(1)点对点模式(一对一的模式,消费者主动拉取数据,消息被消费后会被删除)
消息生产者生产消息后发送到队列,消费者主动到队列中拉取数据,消息被消费后就会被删除,所以点对点模式的消息队列的消息不能被重复消费点对点的消息队列支持多个消费者,但是一条消息只对应一个消费者,只可以被一个消费者消费
在这里插入图片描述
点对点模式的消息队列
(2)发布/订阅模式的消息队列(一对多的消息模式,消息被消费后不会被删除)
生产者将生产的消息发布到topic中,与点对点模式不同的是:一个topic可以被多个消费者消费
在这里插入图片描述
发布/订阅模式的消息队列
4、kafka的基础架构
在这里插入图片描述
名词解释:
1)Producer :消息生产者,就是向 kafka broker 发消息的客户端;
2)Consumer :消息消费者,向 kafka broker 取消息的客户端;
3)Consumer Group (CG):消费者组,由多个 consumer 组成。消费者组内每个消费者负责消费不同分区的数据,一个分区只能由一个组内消费者消费;消费者组之间互不影响。所有的消费者都属于某个消费者组,即消费者组是逻辑上的一个订阅者。
4)Broker :一台 kafka 服务器就是一个 broker。一个集群由多个 broker 组成。一个 broker可以容纳多个 topic。
5)Topic :可以理解为一个队列,生产者和消费者面向的都是一个 topic;
6)Partition:为了实现扩展性,一个非常大的 topic 可以分布到多个 broker(即服务器)上,一个 topic 可以分为多个 partition,每个 partition 是一个有序的队列;
7)Replica:副本,为保证集群中的某个节点发生故障时,该节点上的 partition 数据不丢失,且 kafka 仍然能够继续工作,kafka 提供了副本机制,一个 topic 的每个分区都有若干个副本,一个 leader 和若干个 follower。
8)leader:每个分区多个副本的“主”,生产者发送数据的对象,以及消费者消费数据的对象都是 leader。
9)follower:每个分区多个副本中的“从”,实时从 leader 中同步数据,保持和 leader 数据的同步。leader 发生故障时,某个 follower 会成为新的 follower。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值