分布式消息中间件之Kafka（含一键启动，关闭Kafka集群）

最新推荐文章于 2024-07-13 11:00:46 发布

Forever_ck

最新推荐文章于 2024-07-13 11:00:46 发布

阅读量1k

点赞数 3

分类专栏： Kafka 文章标签：大数据消息中间件脚本 Kafka

本文链接：https://blog.csdn.net/Forever_ck/article/details/84677819

版权

本文介绍了消息中间件Kafka，包括其作为分布式消息队列的作用，Kafka的内部实现原理如点对点和发布/订阅模式，以及为何需要消息队列来解耦、冗余数据等。还详细讲解了Kafka的架构组件如Producer、Consumer、Topic、Partition等，并阐述了Kafka集群的部署步骤和关闭脚本，以及管理Topic的基本命令。

摘要由CSDN通过智能技术生成

在了解kafka前，我们首先要了解一个问题：
什么叫做消息中间件？
消息中间件利用高效可靠的消息传递机制进行平台无关的数据交流，并基于数据通信来进行分布式系统的集成。通过提供消息传递和消息排队模型，它可以在分布式环境下扩展进程间的通信。
了解了什么叫做消息中间件之后，我们再来看下Kafka：
一 Kafka概述
1.1 Kafka是什么
在流式计算中，Kafka一般用来缓存数据，Storm或者Spark通过消费Kafka的数据进行计算。
1）Apache Kafka是一个开源消息系统，由Scala写成。是由Apache软件基金会开发的一个开源消息系统项目。
2）Kafka最初是由LinkedIn公司开发，并于 2011年初开源。2012年10月从Apache Incubator毕业。该项目的目标是为处理实时数据提供一个统一、高通量、低等待的平台。
3）Kafka是一个分布式消息队列。Kafka对消息保存时根据Topic进行归类，发送消息者称为Producer，消息接受者称为Consumer，此外kafka集群有多个kafka实例组成，每个实例(server)成为broker。
4）无论是kafka集群，还是producer和consumer都依赖于zookeeper集群保存一些meta信息，来保证系统可用性。
1.2 消息队列内部实现原理
在这里插入图片描述
（1）点对点模式（一对一，消费者主动拉取数据，消息收到后消息清除）
点对点模型通常是一个基于拉取或者轮询的消息传送模型，这种模型从队列中请求信息，而不是将消息推送到客户端。这个模型的特点是发送到队列的消息被一个且只有一个接收者接收处理，即使有多个消息监听者也是如此。
（2）发布/订阅模式（一对多，数据生产后，推送给所有订阅者）
发布订阅模型则是一个基于推送的消息传送模型。发布订阅模型可以有多种不同的订阅者，临时订阅者只在主动监听主题时才接收消息，而持久订阅者则监听主题的所有消息，即使当前订阅者不可用，处于离线状态。
1.3 为什么需要消息队列
1）解耦：
　　允许你独立的扩展或修改两边的处理过程，只要确保它们遵守同样的接口约束。
2）冗余：
消息队列把数据进行持久化直到它们已经被完全处理，通过这一方式规避了数据