ApacheKafka：事件流平台的应用、核心概念与与传统消息队列比较-CSDN博客

本文链接：https://blog.csdn.net/yunyun1886358/article/details/135433558

Apache Kafka是一个开源分布式事件流平台，被数千家公司用于高性能数据管道、流分析、数据集成和关键任务应用程序。
事件流（event streaming）：从技术上讲，事件流是以事件流的形式从数据库、传感器、移动设备、云服务和软件应用程序等事件源实时捕获数据的做法；持久地存储这些事件流以供以后检索；实时地以及回顾性地操纵、处理和响应事件流；以及根据需要将事件流路由到不同的目的地技术。因此，事件流确保了数据的连续流动和解释，从而使正确的信息在正确的时间、正确的地点出现。

1 Kafka的应用场景

1.1 活动跟踪

收集客户互动和订单并立即做出反应，如零售、酒店和旅游业以及移动应用程序。
实时跟踪和监控汽车、卡车、车队和货运，如物流和汽车行业。

1.2 消息传递

连接、存储公司不同部门产生的数据并使其可用。
作为数据平台、事件驱动架构和微服务的基础。

1.3 指标和日志记录

持续捕获和分析来自物联网设备或其他设备（如工厂和风电场）的传感器数据。
监测医院护理中的患者并预测病情变化，以确保在紧急情况下及时治疗。

1.4 提交日志

复制数据库提交日志到远程系统。
合并数据库更新。
恢复系统。

1.5 流式处理

实时处理支付和金融交易，例如在证券交易所、银行和保险中。

2 Kafka与传统消息队列的区别

Kafka与传统消息队列在设计和使用方式上存在一些区别。下面是一些详细的解释：

存储方式
传统消息队列：传统消息队列通常使用先进先出(FIFO)的方式存储消息。一旦消费者读取了消息，该消息就会从队列中删除。

Kafka：Kafka使用一种持久化的方式来存储消息，消息被保存在磁盘上的主题日志中。消费者可以根据需要多次读取消息，而消息仍然保留在Kafka中，直到到达保留策略设置的时间或大小限制。
发布-订阅模型
传统消息队列：传统消息队列通常使用发布-订阅模型，其中生产者将消息发布到特定的主题，而消费者订阅感兴趣的主题并接收消息。

Kafka：Kafka也支持发布-订阅模型，其中生产者发布消息到特定的主题，但消费者可以以消费者组的形式订阅主题。Kafka将消息传递给每个消费者组中的一个消费者实例，从而实现消息的并行处理。
扩展性
传统消息队列：在传统消息队列中，通常需要使用额外的中间件(如消息队列服务器)来实现扩展性。这些中间件负责管理消息的路由和传递。

Kafka：Kafka本身就是为了高度可扩展性而设计的。它可以通过简单地添加新的服务器节点来扩展吞吐量和存储容量，而无需修改应用程序代码。Kafka使用分区和副本的概念来实现负载均衡和容错性。
消息保证
传统消息队列：传统消息队列通常提供"至少一次"或"最多一次"消息传递语义。这意味着消息可能会重复传递，或者有时可能会丢失。

Kafka：Kafka提供"至少一次"的消息传递保证。它使用了顺序写入和复制机制来确保消息的持久性和可靠性。此外，Kafka还允许开发者根据需求调整传递语义。
消息存储时间
传统消息队列：在传统消息队列中，消息通常只能在有限的时间内存储，过期后将被删除。

Kafka：Kafka的消息在存储上是持久化的，可以根据设置的保留策略(例如时间或大小限制)来保留消息一段时间。这使得Kafka非常适合构建可回放和事件溯源的系统。