3.3Dstream转换操作
无状态转换操作
每个批次(RDD)的处理只局限于当前批次的数据
有状态的转换操作
基于滑动窗口(Windows)的操作
可一次性处理一个窗口中的数据,一个窗口中包含了多个批次
基于状态(state)更新的操作
可将前面批次的运算结果(状态)保存下来,供后续批次访问和更新。
state翻译为状态,实指在程序运行过程中:
3.4无状态转换操作算子
- map
- flatMap
- filter
- repartition
- reduce
- count
- union
- countByValue
- reduceByKey
- join