Kafka入门介绍、安装部署

1、前言

本章节使用的是Apache Kafka,版本:kafka_2.11-2.1.0.tgz;但是实际工作中要考虑CDH环境,使用的是CDH官网的Kafka,所以这里先简单介绍下,如何集成到CDH中,请参考博客:
https://blog.csdn.net/greenplum_xiaofan/article/details/97677328
版本选择:使用的是CDH版本的Kafka,在CDH官网上叫做CDK。
比如:
kafka_2.11-0.10.2-kafka-2.2.0.jar
kafka_2.11::表示scala-2.11版本
0.10.2: 指在apache上的 kafka版本
2.2.0: 这个才是CDH官网上的CDK版本
CDK地址:
https://www.cloudera.com/documentation/kafka/latest/topics/kafka_packaging.html#concept_fzg_phl_br
在这里插入图片描述
Apache Kafka地址:
http://kafka.apache.org/

SparkStraming2.4.2版本官网推荐:apache kafka版本至少0.10.x及以上。
Kafka 0.8和0.10是个分水岭,对比如下(来自Spark官网):
在这里插入图片描述
可以看出0.10版本,只有Direct DStream,不再支持Receiver DSstream;Offset维护在Kafka中。

2、Kafka基本概念

kafka是一个高吞吐的分布式消息系统,一般充当消息中间件,一般是跟流式处理挂钩的,比如SparkStreaming。
Kafka的三个角色:

  • Broker:Kafka集群中server节点,负责读写请求,存储消息,管理分区,无主从关系,依赖zk协调
  • Producer:生产者,负责生产消息,比如从Flume获取数据
  • Consumer:消费者,负责消费消息,比如被SparkStreaming、Flink消费

Kafka这三个角色和Flume的三个角色非常类似,但Flume启动后只有一个进程,而Kafka每个角色都需要启动,有三个进程。

Kafka其他重要概念&#

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值