structed streaming 源码分析

1.load的源码分析

 load=>lookupDataSource

说白了就是构造logic plan 以及为每一个logic 生成df,一定要注意此时所有df中没有数据

2.structed streaming为什么可以实现增量导入

主要是因为会维护一个state,这个state就是用来存最新的update的结果,

此时我们假如去做group by 那么后面的都相当于key

3.structed streaming 的执行过程

df->....(logic plan)->runbatch->getData->excute each logic plan with order->

sink->waiting for 10seconds ->df->.....

4.structed streaming 的group by

如果在sql中做了group by的操作,则以window作为聚合的段,然后把输出模式设置成update

 

 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值