- 它被设计为一个分布式系统,易于向外扩展;
- 一个Topic对应的消息被分区存储,分区位于不同的机器上并且有副本,从而保证很好的扩容,支持大量消息的存储,
- 同时支持并发消费(不同的消费者消费不同的分区)
- 它同时为发布和订阅提供高吞吐量;
- 消费者被分为消费组,一个partition 中的消息只会被group 中的一个consumer 消费;每个group 中consumer 消息消费互相独立
- 它同时支持点对点和广播两种模式
- 因为kafka约定一个消息只能被一个消费组中的一个消费者所消费
- 如果所有的消费者都具有相同的消费组,这样就是点对点模式,一个消息只对应一个消费者;消息将会在consumers之间负载均衡(每个消息被各自的消费者所消费)。如果所有的consumer 都具有不同的group(每个消息可以被各个消费组中的消费者消费),那这就是"发布-订阅",消息将会广播给所有的消费者
- 它将消息持久化到磁盘,因此可用于批量消费,例如ETL,以及实时应用程序。
- 消息被以日志文件的形式存储在磁盘中
- 日志文件以分区的形式存储在各个机器中
(二)分布式流平台之KafKa优势及实现
最新推荐文章于 2024-07-17 20:14:09 发布