spark streaming 学习笔记
StreamingContext:
spark streaming 程序必须创建 StreamingContext对象,她是流处理操作的主入口,
new StreamingContext(sparkContext, Seconds(duration))
传递两个参数 sparkContext和任务提交间隔,时间间隔 根据程序需求和机器性能决定
window/滑动窗口
Spark-Streaming之window滑动窗口应用,Spark Streaming提供了滑动窗口操作的支持,从而让我们可以对一个滑动窗口内的数据执行计算操作。每次掉落在窗口内的RDD的数据,会被聚合起来执行计算操作,然后生成的RDD,会作为window DStream的一个RDD。
需要两个参数 第一个是窗口长度 第二个是滑动间隔 这两个参数必须是 StreamingContext中任务提交间隔的整数倍