Spark Streaming 自适应上游 kafka topic partition 数目变化

最新推荐文章于 2024-07-01 10:55:31 发布

技术蚂蚁

最新推荐文章于 2024-07-01 10:55:31 发布

阅读量3.6k

点赞数 1

分类专栏： Spark Kafka

Spark 同时被 2 个专栏收录

88 篇文章 0 订阅

订阅专栏

Kafka

27 篇文章 0 订阅

订阅专栏

背景

Spark Streaming 作业在运行过程中，上游 topic 增加 partition 数目从 A 增加到 B，会造成作业丢失数据，因为该作业只从 topic 中读取了原来的 A 个 partition 的数据，新增的 B-A 个 partition 的数据会被忽略掉。

思考过程

为了作业能够长时间的运行，一开始遇到这种情况的时候，想到两种方案：

感知上游 topic 的 partition 数目变化，然后发送报警，让用户重启
直接在作业内部自适应上游 topic partition 的变化，完全不影响作业

方案 1 是简单直接，第一反应的结果，但是效果不好，需要用户人工介入，而且可能需要删除 checkpoint 文件

方案 2 从根本上解决问题，用户不需要关心上游 partition 数目的变化，但是第一眼会觉得较难实现。

方案 1 很快被 pass 掉，因为人工介入的成本太高，而且实现起来很别扭。接下来考虑方案 2.

Spark Streaming 程序中使用 Kafka 的最原始方式为 KafkaUtils.createDirectStream 通过源码，我们找到调用链条大致是这样的

KafkaUtils.createDirectStream -> new DirectKafkaInputDStream -> 最终由 DirectKafkaInputDStream#compute(validTime : Time) 函数来生成 KafkaRDD。

而 KafkaRDD 的 partition 数和作业开始运行时 topic 的 partition 数一致，topic 的 partition 数保存在 currentOffsets 变量中，currentOffsets 是一个 Map[TopicAndPartition, Long]类型的变量，保存每个 partition 当前消费的 offset 值，但是作业运行过程中 currentOffsets 不会增加 key，就是是不会增加 partition，这样导致每次生成 KafkaRDD 的时候都使用开始运行作业时 topic 的 partition 数作为 KafkaRDD 的 partition 数，从而会造成数据的丢失。

解决方案

我们只需要在每次生成 KafkaRDD 的时候，将 currentOffsets 修正为正常的值（往里面增加对应的 partition 数，总共 B-A 个，以及每个增加的 partition 的当前 offset 从零开始）。

第一个问题出现了，我们不能修改 Spark 的源代码，重新进行编译，因为这不是我们自己维护的。想到的一种方案是继承 DirectKafkaInputDStream。我们发现不能继承 DirectKafkaInputDStream 该类，因为这个类是使用 private[streaming] 修饰的。
第二个问题出现了，怎么才能够继承 DirectKafkaInputDStream，这时我们只需要将希望继承 DirectKafkaInputDStream 的类放到一个单独的文件 F 中，文件 F 使用 package org.apache.spark.streaming 进行修饰即可，这样可以绕过不能继承 DirectKafkaInputDStream 的问题。这个问题解决后，我们还需要修改 Object KafkaUtils ，让该 Object 内部调用我们修改后的 DirectKafkaInputDStream（我命名为 MTDirectKafkaInputDStream)
第三个问题如何让 Spark 调用 MTDirectKafkaInputDStream，而不是 DirectKafkaInputDStream，这里我们使用简单粗暴的方式，将 KafkaUtils 的代码 copy 一份，然后将其中调用 DirectKafkaInputDStream 的部分都修改为 MTDirectKafkaInputDStream，这样就实现了我们的需要。当然该文件也需要使用 package org.apache.spark.streaming 进行修饰

总结下，我们需要做两件事

修改 DirectKafkaInputDStream#compute 使得能够自适应 topic 的 partition 变更
修改 KafkaUtils，使得我们能够调用修改过后的 DirectKafkaInputDStream

代码

package org.apache.spark.streaming.kafka.mt
 
importcom.meituan.data.util.Constants
importcom.meituan.service.inf.kms.client.Kms
importkafka.common.{ErrorMapping, TopicAndPartition}
importkafka.javaapi.{TopicMetadata, TopicMetadataRequest}
importkafka.javaapi.consumer.SimpleConsumer
importkafka.message.MessageAndMetadata
importkafka.serializer.Decoder
importorg.apache.spark.streaming.{StreamingContext, Time}
importorg.apache.spark.streaming.kafka.{DirectKafkaInputDStream, KafkaRDD}
 
importscala.collection.JavaConverters._
importscala.util.control.Breaks._
importscala.reflect.ClassTag
 
/**
  * Created by qiucongxian on 10/27/16.
  */
class MTDirectKafkaInputDStream[
  K: ClassTag,
  V: ClassTag,
  U <: Decoder[K]: ClassTag,
  T <: Decoder[V]: ClassTag,
  R: ClassTag](
    @transientssc_ : StreamingContext,
    valMTkafkaParams: Map[String, String],
    valMTfromOffsets: Map[TopicAndPartition, Long],
    messageHandler: MessageAndMetadata[K, V] => R
) extends DirectKafkaInputDStream[K, V, U, T, R](ssc_, MTkafkaParams , MTfromOffsets, messageHandler) {
    private valkafkaBrokerList : String = "host1:port1,host2:port2,host3:port3" //根据自己的情况自行修改
 
    overridedefcompute(validTime: Time) : Option[KafkaRDD[K, V, U, T, R]] = {
      /**
        * 在这更新 currentOffsets 从而做到自适应上游 partition 数目变化
        */
        updateCurrentOffsetForKafkaPartitionChange()
        super.compute(validTime)
    }
 
    private defupdateCurrentOffsetForKafkaPartitionChange() : Unit = {
      valtopic = currentOffsets.head._1.topic
      valnextPartitions : Int = getTopicMeta(topic) match {
          case Some(x) => x.partitionsMetadata.size()
          case _ => 0
      }
      valcurrPartitions = currentOffsets.keySet.size
 
      if (nextPartitions > currPartitions) {
        var i = currPartitions
        while (i < nextPartitions) {
          currentOffsets = currentOffsets + (TopicAndPartition(topic, i) -> 0)
          i = i + 1
        }
      }
      logInfo(s"######### ${nextPartitions}  currentParttions ${currentOffsets.keySet.size} ########")
    }
 
    private defgetTopicMeta(topic: String) : Option[TopicMetadata] = {
        var metaData : Option[TopicMetadata] = None
        var consumer : Option[SimpleConsumer] = None
 
        valtopics = List[String](topic)
        valbrokerList = kafkaBrokerList.split(",")
        brokerList.foreach(
          item => {
            valhostPort = item.split(":")
            try {
              breakable {
                  for (i <- 0 to 3) {
                      consumer = Some(new SimpleConsumer(host = hostPort(0), port = hostPort(1).toInt,
                                            soTimeout = 10000, bufferSize = 64 * 1024, clientId = "leaderLookup"))
                      valreq : TopicMetadataRequest = new TopicMetadataRequest(topics.asJava)
                      valresp = consumer.get.send(req)
 
                      metaData = Some(resp.topicsMetadata.get(0))
                      if (metaData.get.errorCode == ErrorMapping.NoError) break()
                  }
              }
            } catch {
              case e => logInfo(s" ###### Error in MTDirectKafkaInputDStream ${e} ######")
            }
          }
        )
        metaData
    }
}