1-structedStreaming-基本流程(2.3.1)

本文详细介绍了Spark 2.3.1中结构化流处理的基本流程,包括新定义的接口如DataSourceV2、MicroBatchReader、ContinuousReader等,以及StructuredNetworkWordCount示例的加载数据、查询启动和数据处理过程。重点讨论了微批处理和连续处理模式,并阐述了StreamExecution的执行机制。
摘要由CSDN通过智能技术生成

基本流程 -- spark 2.3.1

新定义接口 -- 中间使用了一些过度接口为了兼容老版本如:BaseStreamingSource

  • DataSource为一个类, 定义了可插拔的数据源,对应一些列旧的数据源
  • DataSourceV2 spark2.3.1新接口,只是一个接口,没有任何方法,需要配合ReadSupport或者WriteSupport接口等一起
    • MicroBatchReadSupport -- 实现创建MicroBatchReader
      • RateSourceProviderV2
    • ContinuousReadSupport -- 低延迟流处理支持接口
  • DataSourceReader -- spark2.3.1接口,优化读取新能
    • MicroBatchReader -- 微批处理模式,从数据微批量读取数据接口
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值