第20课:Spark Streaming中动态Batch Size实现初探

第20课:Spark Streaming中动态Batch Size实现初探
1 Batch duration 与Process Time
2 动态Batch size

Spark Streaming中有很多算子,每一个算子不会呈现线性规律, Batch duration处理数据越大,时间不会线性增长。
数据量大,不是加大Batch duration就能解决问题。

一切终端一切媒体都会变成实时交互性分布式流处理的媒体。

一年前看的一篇英文paper,收获很大,学习很多思路,会对流处理有很深刻的认识。

 

Adaptive Stream Processing using Dynamic Batch Sizing

Tathagata Das  University of California Berkeley
Yuan Zhong  Columbia University
Ion Stoica Scott Shenker University of California Berkeley

 

liuhui_306  读者的要求,补充了部分内容;

Adaptive Stream Processing using Dynamic Batch Sizing论文思想博大精深,先窥其一二,在以后的学习中再逐步深入了。


这个论文的一个观点是要尽量把batch变小。越小,则越快,也就越安全。任何事物只要足够快,就可以屏蔽掉所有问题。

但在指定时间窗口限制下,对于Batch size调整幅度

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

段智华

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值