自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

王鸿飞的专栏

简书: https://www.jianshu.com/u/5267bcbeb04d CSDN也会同步更新

spark

关注

关注数：文章数：1 文章阅读量：7085 文章收藏量：8

作者: 司青-已停止更新

本博客已停更；

展开

Spark Streaming: 保存上一个批次数据的计算结果

在Spark Streaming计算模型下，有时候我们对当前 batch 数据的计算需要依赖上一个 batch 的计算结果，如广告系统中检索日志和曝光时间的join拼接。这时可以使用JavaStreamingContext#remember()方法完成。该方法需要一个时间参数，用来指定要”记住”多久时间内的 RDD 数据。但是悲剧的是，文档对被”记住”的数据在哪里、如何引入这些数据却没有任何说明，这

原创 2017-12-08 19:25:41 · 7085 阅读 · 7 评论