卡夫卡消息队列

最新推荐文章于 2024-09-24 08:55:15 发布

嘻嘻月光吸血鬼

最新推荐文章于 2024-09-24 08:55:15 发布

阅读量1.9k

点赞数

文章标签： kafka

本文链接：https://blog.csdn.net/qq_16054979/article/details/119117233

版权

本文详细介绍了Kafka消息队列的基本特性，包括可扩展性、高性能和持久存储。讨论了消息格式，包括topic、partition和消息顺序。阐述了生产者和消费者的原理，特别是consumer group的概念。还提供了Kafka的安装教程，包括配置文件修改和集群启动。最后，对比了MQ的优缺点以及Kafka与其他MQ的区别，并给出了简单的Kafka编程示例。

摘要由CSDN通过智能技术生成

1.1 消息队列
1.1.1 基本特性
可扩展
在不需要下线的情况下进行扩容
数据流分区(partition)存储在多个机器上
高性能
单个broker就能服务上千客户端
单个broker每秒种读/写可达每秒几百兆字节
多个brokers组成的集群将达到非常强的吞吐能力
性能稳定，无论数据多大
持久存储
存储在磁盘上
冗余备份到其他服务器上以防止丢失
1.1.2 消息格式
一个topic对应一种消息格式，因此消息用topic分类
一个topic代表的消息有1个或者多个patition(s)组成
一个partition应该存放在一到多个server上
如果只有一个server，就没有冗余备份，是单机而不是集群
如果有多个server，一个server为leader，其他servers为followers，leader需要接受读写请求，followers仅作冗余备份。
leader出现故障，会自动选举一个follower作为leader，保证服务不中断。每个server都可能扮演一些partitions的leader和其它partitions的follower角色，这样整个集群就会达到负载均衡的效果。
消息按顺序存放
消息顺序不可变
只能追加消息，不能插入
每个消息都有一个offset，用作消息ID, 在一个partition中唯一offset有consumer保存和管理，因此读取顺序实际上是完全有consumer决定的，不一定时线性的。
消息有超时日期，过期则删除。
1.1.3 生产者 producer
producer将消息写入kafka，写入要指定topic和partition，消息如何分到不同的partition，算法由producer指定。
1.1.4 消费者 consumer
consumer读取消息并作处理
consumer group 这个概念的引入为了支持两种场景：每条消息分发一个消费者，每条消息广播给所有消费者。多个consumer group订阅一个topic，该topci的消息广播给所有consumer group；一条消息发送到一个consumer group后，只能由该group的一个consumer接收和使用。一个group中的每个consumer对应一个partition可以带来如下好处，可以按照partition的数目进行并发处理，每个partition都只有一个consumer读取，因而保证了消息被处理的顺序是按照partition的存放顺序进行，注意这个顺序受到producer存放消息的算法影响。
1.2 卡夫卡安装教程
1.2.1安装前期准备
1，准备三个节点（根据自己需求决定）
2，三个节点上安装好zookeeper（也可以使用kafka自带的zookeeper）
3，关闭防火墙 chkconfig iptables off
1.2.2下载安装包
Kafka官网下载安装包 http://kafka.apache.org/downloads.html，将安装包存在在 /software/ 下。
1.2.3解压安装包
我选择将kafka安装在 /usr/local/ 这个目录下。tar -zxvf /software/ kafka_2.11-0.9.0.1.tar.gz –C /usr/local/
1.2.4修改配置文件
配置文件在 /usr/local/k