Structured Streaming配置Kafka参数

最新推荐文章于 2023-01-30 16:19:05 发布

sunyang098

最新推荐文章于 2023-01-30 16:19:05 发布

阅读量1k

点赞数 1

分类专栏： spark 文章标签： spark streaming kafka 配置

本文链接：https://blog.csdn.net/a822631129/article/details/109531690

版权

spark 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

     override def stream(): DataFrame = {

        val kafkaConf = new KafkaConfiguration
        val spark = GxSparkSession().session()
        val df: DataFrame = spark
          .readStream
          .format("kafka")
          .option("subscribe", kafkaConf.intelligentDrivingTopic)               // 智驾车的 topic
          .option("kafka.bootstrap.servers", kafkaConf.bootstrapServers)        // BootstrapServers
          .option("startingOffsets", kafkaConf.autoOffsetReset)                 // 从最新的偏移量开始消费
          .option("maxOffsetsPerTrigger", kafkaConf.maxOffsetsPerTrigger)       // 设置最大偏移量数
          .option("kafka.max.partition.fetch.bytes", kafkaConf.maxPartitionFetchBytes)                   // 设置fetch最大字节
          .option("failOnDataLoss", kafkaConf.failOnDataLoss)                   // 设置 failOnDataLoss 为 false
          .load()

        val source = df.selectExpr("CAST(key AS STRING)", "CAST(value AS STRING)")
          .select("key", "value")
        source
      }

如上图，kafak参数要加“kafka.”前缀，如max.partition.fetch.bytes

因为structured streaming的kafak source实现里是将structured streaming参数和kafka参数区分开的

sunyang098

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Structured Streaming配置Kafka参数

override def stream(): DataFrame = { val kafkaConf = new KafkaConfiguration val spark = GxSparkSession().session() val df: DataFrame = spark .readStream .format("kafka") .option("subscribe", kafk...
复制链接

扫一扫