SparkStreaming如何消费Kafka

最新推荐文章于 2024-07-28 16:45:11 发布

Qen.X

最新推荐文章于 2024-07-28 16:45:11 发布

阅读量918

点赞数

分类专栏： Spark 文章标签： spark 大数据 kafka

本文链接：https://blog.csdn.net/QenXX/article/details/118445968

版权

引言

目前来说大部分使用SparkStreaming的项目，都是从Kafka消费数据，为此SparkStreaming提供了一套连接Kafka消费数据的API，使用此套API可以方便智能的建立与Kafka分区的连接，而不再是使用Receiver收数据并转发，以下是对官方文档的翻译及自己的理解。

SparkStreaming消费Kafka

SparkStreaming提供了并行连接kafka的API而不需要使用Receiver。Kafka分区数会与Executor数1：1对应。

操作步骤如下

1.引入依赖

groupId = org.apache.spark
artifactId = spark-streaming-kafka-0-10_2.12
version = 3.1.2

2.创建DStream

val kafkaParams = Map[String, Object](
  "bootstrap.servers" -> "localhost:9092,anotherhost:9092",
  "key.deserializer" -> classOf[StringDeserializer],
  "value.deserializer" -> classOf[StringDeserializer],
  "group.id" -> "use_a_separate_group_id_for_each_stream",
  "auto.offset.reset" -> "latest",
  "enable.auto.commit" -><

最低0.47元/天解锁文章

Qen.X

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
SparkStreaming如何消费Kafka

引言目前来说大部分使用SparkStreaming的项目，都是从Kafka消费数据，为此SparkStreaming提供了一套连接Kafka消费数据的API，使用此套API可以方便智能的建立与Kafka分区的连接，而不再是使用Receiver收数据并转发，以下是对官方文档的翻译及自己的理解。SparkStreaming消费KafkaSparkStreaming提供了并行连接kafka的API而不需要使用Receiver。Kafka分区数会与Executor数1：1对应。操作步骤如下1.引入依赖
复制链接

扫一扫

专栏目录