spark官方文档中文版_spark系列：Spark Streaming官方文档译文

最新推荐文章于 2022-05-12 11:31:20 发布

VIP文章昕痕

最新推荐文章于 2022-05-12 11:31:20 发布

阅读量499

点赞数

文章标签： spark官方文档中文版

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35433770/article/details/113318316

版权

概述

spark stream是对spark core api的扩展；对于spark core不太了解的请阅读：spark系列：spark core 数据交互技术点(数据模型)。所以本质上是通过批处理来模拟流处理。

spark stream的流数据源可以来自Kafka, Flume, Kinesis, 或 TCP sockets甚至是文件。

spark stream

对于流数据可以做很多复杂的处理(只有想不到，没有做不到的)，如map操作、reduce操作、join操作，甚至是在线训练机器学习模型等等。

最终处理完之后的数据可以写入各种文件系统，如HDFS、数据库等等。

内部机制

spark stream模块接收流数据，并按照时间维度将其分割成一段段的小量的批数据，然后通过spark core引擎来处理。

批处理模拟流处理

对外提供的接口本质上是对离散小批量数据(discretized stream or DStre

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark官方文档中文版_spark系列：Spark Streaming官方文档译文

概述spark stream是对spark core api的扩展；对于spark core不太了解的请阅读：spark系列：spark core 数据交互技术点(数据模型)。所以本质上是通过批处理来模拟流处理。spark stream的流数据源可以来自Kafka, Flume, Kinesis, 或 TCP sockets甚至是文件。spark stream对于流数据可以做很多复杂的处理(只有想...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。