批处理和流处理如何区分？有边界数据和无边界数据如何区分？

最新推荐文章于 2023-06-02 14:40:10 发布

Shockang

最新推荐文章于 2023-06-02 14:40:10 发布

阅读量1.2w

点赞数 17

分类专栏：大数据理论体系文章标签：大数据

本文链接：https://blog.csdn.net/Shockang/article/details/115609919

版权

大数据理论体系专栏收录该内容

99 篇文章 304 订阅

订阅专栏

写在前面

本文隶属于专栏《100个问题搞定大数据理论体系》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！

本专栏目录结构和文献引用请见100个问题搞定大数据理论体系

解答

这个世界上的数据可以抽象成为两种，分别是无边界数据( Unbounded Data)和有边界数据( Bounded Data)。

无边界数据

顾名思义，无边界数据是一种不断增长，可以说是无限的数据集。
这种类型的数据，我们无法判定它们到底什么时候会停止发送。
在国外的一些技术文章上，有时候我们会看到“流数据( Streaming Data)”这一说法， 其实它和无边界数据表达的是同一个概念。

有边界数据

与此相反，有边界数据是一种有限的数据集。
这种数据更常见于已经保存好了的数据中。例如，数据库中的数据，或者是我们常见的CSV格式文件中的数据。
有边界数据其实可以看作是无边界数据的一个子集。

批处理

数据的批处理，可以理解为一系列相关联的任务按顺序(或并行)一个接一个地执行。批处理的输入是在一段时间内已经收集保存好的数据。每次批处理所产生的输出也可以作为下ー次批处理的输入。

流处理

数据的流处理可以理解为系统需要接收并处理一系列连续不断变化的数据。例如，旅行预订系统，处理社交媒体更新信息的有关系统等等。

Shockang

关注

17
点赞
踩
17

收藏

觉得还不错? 一键收藏
20
评论
批处理和流处理如何区分？有边界数据和无边界数据如何区分？

写在前面本文隶属于专栏《100个问题搞定大数据理论体系》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！本专栏目录结构和文献引用请见100个问题搞定大数据理论体系解答这个世界上的数据可以抽象成为两种，分别是无边界数据( Unbounded Data)和有边界数据( Bounded Data)。无边界数据顾名思义，无边界数据是一种不断增长，可以说是无限的数据集。这种类型的数据，我们无法判定它们到底什么时候会停止发送。在国外的一些技术文章上，有时候我们会看到“
复制链接

扫一扫