苏先生kafka学习(一)

本文介绍了Kafka的基础知识,包括其作为分布式消息系统的角色,主要组件如producer、broker、consumer、topic和partition的工作原理,以及持久化、复制、acks等核心设计。Kafka以其高吞吐量、消息持久化和分区复制等特点,广泛应用于数据管道和消息传递。此外,还探讨了消息的At most once、At least once和Exactly once分发语义以及复制策略。
摘要由CSDN通过智能技术生成

1、什么是kafka

(1)Kafka是一种高吞吐量的、分布式、快速、可扩展的、分区和可复制,基于发布/订阅模式的消息系统,是Apache项目的一个顶级项目。使用Scala语言编写,目前已被广泛应用于各行业各类型的数据管道和消息系统中。
(2)Kafka可以同时满足在线实时处理和批量离线处理;在大数据生态系统中,通常将Kafka作为数据交换枢纽,不同类型的系统(关系数据库、NoSQL数据库、流处理系统、批处理系统等)可以统一接入到Kafka,实现和Hadoop各个组件之间的不同类型数据的实时高效交换。
(3)kafka特性:1、通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能;2、高吞吐量。即使是非常普通的硬件kafka也可以支持每秒数十万的消息;3、支持通过kafka服务器和消费机集群来分区消息;4、支持Hadoop并行数据加载;

2、kafka基本组件

(1)producer
生产者,是broker中发送消息的一方;
(2)broker
kafka集群包括多台服务器,一台kafka服务器就是一个broker,一个集群有多个broker组成,一个broker可以包含多个topic,broker承担着中间缓存和分发的作用,将producer发送的消息分发到consumer中;
(3)topic
kafka消息是通过topic进行分类,一个topic认为一类消息,每

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值