【Spark Streaming】（二）DStream 编码实战_简述dstream的编程模型(1)

2401_84181942

于 2024-05-03 17:06:47 发布

阅读量968

点赞数 21

分类专栏：程序员文章标签： spark 大数据分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84181942/article/details/138419864

版权

文章目录

- 一、前言

一、前言

从前一篇博客【Spark Streaming】（一）架构及工作原理 🌺，我们了解到 Sprak Streaming 是属于 Saprk API 的扩展，它支持实时数据流（live data streams）的可扩展，高吞吐（hight-throughput）容错（fault-tolerant）的流处理。可以接受来自KafKa、Flume、ZeroMQ、Kinesis 、Twitter或TCP套接字的数据源，处理的结果数据可以存储到文件系统、数据库、现场dashboards等。

二、DStream 编程模型

Dstream 是 Spark Streaming 中的高级抽象连续数据流，这个数据源可以从外部获得（如KafKa / Flume 等），也可以通过输入流获得，还可以通过在其他 DStream 上进行高级操作创建，DStream 是通过一组时间序列上连续的 RDD表示的，所以一个 DStream 可以看作是一个 RDDs 的序列。（关于 DStream 的深入了解，可看第一篇博客！ 🚀）

最低0.47元/天解锁文章

关注

21
点赞
踩
29

收藏

觉得还不错? 一键收藏
0
评论
【Spark Streaming】（二）DStream 编码实战_简述dstream的编程模型(1)

从前一篇博客【Spark Streaming】（一）架构及工作原理🌺，我们了解到是属于 Saprk API 的扩展，它支持实时数据流（live data streams）的可扩展，高吞吐（hight-throughput）容错（fault-tolerant）的流处理。可以接受来自KafKa、Flume、ZeroMQ、Kinesis 、Twitter或TCP套接字的数据源，处理的结果数据可以存储到文件系统、数据库、现场dashboards等。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。