sparkStreaming-检查点机制与驱动器容错

SparkStreaming的检查点机制:

检查点机制是用来保障容错性的主要机制。

控制发生失败时需要重算的状态数:

设置检查点的话,那么程序发生失败的时候,可以直接通过检查点的记录来继续计算,而不需要再重新算一遍。

提供驱动器程序容错:

如果流计算中的驱动器程序崩溃了,你可以重启驱动器程序,并让驱动器程序从检查点回复,这样SparkStreaming就可以读取之前运行的程序处理数据的进度,并从那里继续。

SparkStreaming的驱动器程序容错:

StreamingContext.getOrCreate():可以从错误中恢复驱动器程序
  def createStreamingContext(): StreamingContext = {
    val appName = "SparkStreaming"
    val conf = new SparkConf().setAppName(appName).setMaster("local[2]")
    val sc = new SparkContext(conf)
    val ssc = new StreamingContext(sc, Seconds(5))
//    ssc.checkpoint("hdfs://nameservice1:8020/home/fixFile/check")
    ssc.checkpoint("C:\\Users\\MK\\Desktop\\tmp\\check01")
    //kafka参数
    val kafkaParam = Map[String, String](//kafka低级api配置
      "zookeeper.connect" -> "sxjdb03:2181,sxjdb01:2181", //配置zookeeper args(0)
      "metadata.broker.list" -> "sxjdb01:9092",
      "group.id" -> "gtTest1", //设置一下group id
      "auto.offset.reset" -> kafka.api.OffsetRequest.LargestTimeString, //从该topic最新的位置开始读数
      "client.id" -> "gtTest1",
      "zookeeper.connection.timeout.ms" -> "10000"
    )
    val topicSet = Set("t_mk")
    val directKafka: InputDStream[(String, String)] = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder](ssc, kafkaParam, topicSet)
    val windowed = directKafka.map(x => x._2.toInt)
    val result = windowed.map((_, 1)).print()
    ssc
  }
  def main(args: Array[String]): Unit = {
    val ssc = StreamingContext.getOrCreate("C:\\Users\\MK\\Desktop\\tmp\\check01", createStreamingContext _)
    ssc.start()
    ssc.awaitTermination()
  }

前提是:将程序提交到集群中->所以需要数据参数

  --deploy-mode cluster

         设置监听参数来让Spark重启失败的驱动器程序:

--supervise

Spark-submit --deploy-mode cluster --supervise --master spark://..... **.jar


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值