第一章(1)——Kafka概述、介绍以及基础架构

Kafka概述、介绍

Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以收集并处理用户在网站中的所有动作流数据以及物联网设备的采样信息。

Apache Kafka是Apache软件基金会的开源的流处理平台,该平台提供了消息的订阅与发布的消息队列,一般用作系统间解耦、异步通信、削峰填谷等作用。同时Kafka又提供了Kafka streaming插件包实现了实时在线流处理。相比较一些专业的流处埋框架不同,Kafka Streaming计算是运行在应用端,具有简单、入门要求低、部署方便等优点。

kafka包括

  • 消息队列Message Queue
  • Kafka Streaming 流处理

消息队列加载在流计算之前主要是为了给流计算做缓冲,消息队列加载在数据库之前主要是降低流计算给数据库带来的冲击

  1. 异步通信
  2. 模块与模块间的解耦
  3. 应用于大流量场景,削峰填谷

流处理相对于storm/spark stream/flink kafka也有不可替代的点,在应用端,易部署

kafka的基础架构

kafka集群以Topic形式负责分类集群中的Record,每一个Record属于一个Topic,每个Topic底层都会对应一组分区的日志用于持久化Topic中的Record。同时在Kafka集群中,Topic的每一个日志的分区都一定会有一个Borker担当该分区的leader,其他的Broker担当该分区的follower。Leader负责分区数据的读写操作,follower负责同步改分区的数据。这样如果分区的leader宕机,该分区的其他follower会选取出新的leader继续负责该分区数据的读写.其中集群的中Leaderi的监控和Topic的部分元数据是存储Zookeeper中。

在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值