前言
Kafka 是一个分布式的、发布-订阅式消息中间件。最初是由 Linkedin 领英公司基于 Scala 和 Java 语言开发的分布式消息系统,现已捐献给 Apache 软件基金会。事实上 Kafka 不仅仅是一个消息队列(MQ),其已然成为一个开源的分布式流处理平台。Kafka 具有高吞吐、低延迟的特性,许多大数据处理系统比如 Storm、Spark、Flink 等都能很好地与之集成。
目录
1、Kafka是什么?
2、partition的数据文件(offffset,MessageSize,data)
3、数据文件分段 segment(顺序读写、分段命令、二分查找)
4、负载均衡(partition会均衡分布到不同broker上)
5、批量发送
6、压缩(GZIP或Snappy)
7、消费者设计
8、Consumer Group
9、如何获取topic主题的列表
10、生产者和消费者的命令行是什么?
11、consumer是推还是拉?
12、讲讲kafka维护消费状态跟踪的方法
13、讲一下主从同步。
14、为什么需要消息系统ÿ