Spark 检查点

一般是在具有容错能力,高可靠的文件系统上(比如HDFS, S3等)设置一个检查点路径,用于保存检查点数据。设置检查点可以在应用程序中使用streamingContext.checkpoint(checkpointDirectory)来指定路径。 
  如果想要应用程序在失败重启时使用到检查点存储的元数据信息,需要应用程序具有以下两个特性,需要使用StreamingContext.getOrCreate代码在失败时重新创建StreamingContext对象:

  • 当应用程序是第一次运行时,创建一个新的StreamingContext对象,然后开始执行程序处理DStream。
  • 当应用程序失败重启时,可以从设置的检查点路径获取元数据信息,创建一个StreamingContext对象,并恢复到失败前的状态。

        def functionToCreateContext(): StreamingContext = {
            val ssc = new StreamingContext(...)   // 创建一个新的StreamingContext对象
            val lines = ssc.socketTextStream(...) // 得到DStreams
            ...
            ssc.checkpoint(checkpointDirectory)   // 设置checkpoint路径
            ssc
            }
    
    // 用checkpoint元数据创建StreamingContext对象或根据上面的函数创建新的对象
            val context = StreamingContext.getOrCreate(checkpointDirectory, functionToCreateContext _)
    
    // 设置context的其他参数
            context. ...
    
    // 启动context
            context.start()
            context.awaitTermination()
    如果checkpointDirectory路径存在,会使用检查点元数据恢复一个StreamingContext对象。如果路径不存在,或者程序是第一次运行,则会使用functionToCreateContext来创建一个新的StreamingContext对象


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值