回顾Kafka

词汇族

已于 2022-06-18 16:14:06 修改

阅读量611

点赞数

分类专栏： Kafka 文章标签： kafka 分布式 big data

于 2022-05-12 23:04:29 首次发布

本文链接：https://blog.csdn.net/Q3838418/article/details/124742249

版权

本文深入探讨了Kafka，包括它的定义、使用场景、核心概念如Partition、LEO与HW，以及消息生产和消费机制。重点介绍了Kafka的分区存储策略、消费组的Rebalance过程、Controller的角色以及副本选举。此外，还讨论了Kafka的高性能原因，如磁盘顺序读写、零拷贝和批量处理。最后，列举了线上环境常见的问题如消息丢失、重复消费、乱序和积压，并提出了相应的解决策略。

摘要由CSDN通过智能技术生成

1.是什么？

Kafka是一个分布式、支持分区、多副本的，基于zookeeper协调的分布式消息中间件

2 使用场景

核心的场景、原因有 3 个：解耦、异步、削峰。

具体：

日志收集
消息系统：解耦和生产者和消费者、缓存消息等。
用户活动跟踪：用户的各种活动，如浏览、搜索、点击等活动，发布到kafka的topic中，然后订阅者通过订阅这些topic来做实时的监控分析，或者装载到hadoop、数据仓库中做离线分析和挖掘。
运营指标：包括收集各种分布式应用的数据，生产各种操作的集中反馈，比如报警和报告。

3.基本概念术语

名称	解释
Broker	一个Kafka节点即是一个broker，一个或者多个Broker可以组成一个Kafka集群
Topic	Kafka根据topic对消息进行归类，发布到Kafka集群的每条消息都需要指定一个topic
Producer	消息生产者，向Broker发送消息的客户端
Consumer	消息消费者，从Broker读取消息的客户端
ConsumerGroup	每个Consumer属于一个特定的Consumer Group，一条消息可以被多个不同的Consumer Group消费，但是一个Consumer Group中只能有一个Consumer能够消费该消息
Partition	物理上的概念，一个topic可以分为多个partition，每个partition内部消息是有序的
offset	partition中的消息的唯一的编号
Controller	Kafka集群中会有一个或者多个broker，其中有一个broker会被选举为控制器（Kafka Controller），它负责管理整个集群中所有分区和副本的状态。
leader	leader和follower是针对partition，而controller是针对broker的，leader 负责partition的所有读写请求，其它follewer只接收leader同步来的数据