Structured Streaming 作为 Spark 家族的新成员,通过 Spark SQL/DataFrame 来处理 Batch/Streaming 数据,基本的 SparkSQL API 即可实现离线处理和流式处理,大大的方便了流式计算的开发,另外还提供了丰富的功能。
本次 Chat 就是从零开始,带领大家认识学习 Structured Streaming,主要内容包括:
- Structured Streaming 基本案例;
- Process 与 Event 窗口的区别及 Watermarks 的使用;
- 三种 Output Modes 方式;
- Streaming Queries 的监控。
阅读全文: http://gitbook.cn/gitchat/activity/5c24ca12a11fd6601d19ff36
您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。