Spark Streaming(二十五)初始化StreamingContext、初识DStream

初始化StreamingContext

初始化一个SparkStreaming程序,必须创建StreamingContext对象,因为它是SparkStreaming处理流式数据的入口。

 def main(args: Array[String]): Unit = {

    //初始化SparkConf
    val conf = new SparkConf().setMaster("local[2]").setAppName("Streamingtest")
    /**
      * 初始化StreamingContext,并设置2秒一次批处理
      * appName就是展示在SparkUI上应用的名称
      * master:就是Spark、Mesos、Yarn cluster Url,或者指定为"local[*]"运行在本地、实际应用程序运行在集群上,
      *         我们不应该将master硬编码在程序中,但是作为本地测试,你可以用"local[*]"这种方式,如果提交到集群上
      *         不要用这种方式,要按照实际的环境有外部传入该参数。
      */
    val streaming = new StreamingContext(conf, Seconds(2))

一个StreamingContext对象也可以由已经存在的SparkContext进行创建

 def main(args: Array[String]): Unit = {
    //创建SparkConf
    val conf = new SparkConf().setAppName("").setMaster("local[2]")
    
    //创建SparkContext
    val sc = new SparkContext(conf)

    //由已经存在的SparkContext创建StreamingContext
    val streaming = new StreamingContext(sc, Seconds(2))
  }

SparkStreaming编码开发流程

StreamingContext创建完成以后,那么我们就会进行一下步骤,开始应用程序的开发

  • 定义一个输入源来创建DStream
  • 定义DStream的转换操作和输出操作
  • 开始等待数据的输入和处理streamingContext.start()
  • 等待正在处理的程序停止streamingContext.awaitTerminathion()
  • 通过stremingContext.stop()手动停止处理程序

SparkStreaming开发过程要注意的事项

  • 当一个StreamingContext已经启动了,就不能添加或者设置新的流式计算。也就是在streamingContext.start()的代码后边就不能再利用streamingContext创建新的流式计算。
  • StreamingContext停止后,就会无法启动。也就是说在streamingContext.stop()后边在此执行streamingContext.start()是无效的。
  • 在虚拟机中只能同时激活一个StreamingContext
  • StreamingContextstop方法,也会停止SparkContext,如果执行停止StreamingContext,只需要在stop方法内指定是否终止SparkContext,默认是true,需要指定为falsestreamingContext.stop(false)
  • 只要在创建下一个StreamingContext的时候停止前一个StreamingContext(不停止SparkContext),就可以重复利用SparkContext创建多个StreamingContext

离散流(DStream)

DStream(Discretized Stream)SparkStreaming提供的一种抽象。它是一种连续的数据流,它可以使从接收到的输入数据流 ,也可以是通过转换输入流后得到的数据流。数据流的内部就是一系列的RDDDStream中每个RDD都是特定时间间隔内的数据。操作数据流最终都会转换最底层的RDD上的操作。如图所示
在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值