大数据处理引擎简介

最新推荐文章于 2024-09-05 23:07:21 发布

Xzzz2020

最新推荐文章于 2024-09-05 23:07:21 发布

阅读量1.5k

点赞数

分类专栏： Java大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43040688/article/details/104944976

版权

Java大数据专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文介绍了三种主要的大数据处理引擎：用于批量处理静态数据的MapReduce，适合在线计算且对实时性要求高的流式处理技术Storm，以及针对大规模图数据处理的Pregel。每种技术都针对不同特性的数据和应用场景进行了优化。

摘要由CSDN通过智能技术生成

三种大数据处理引擎

批量大数据处理

数据特点：静态数据
场景：离散计算，対实时性要求不高
代表技术：MapReduce

MapReduce

一次计算可以分为映射和规约两个阶段
拿到数据进行预处理
先被分成各个数据块
Map阶段：读取数据，生成键（词）值（对应词出现的次数）对形式的中间结果，存储到本地内存，并定期写入磁盘并进行分区交互给Reduce阶段。
Reduce阶段：拿到Map阶段的数据后进行排序，key相同的键值对进行规约累加，计算结果存储到规定位置进行输出。完成所有操作给用户反馈

举例：

在这里插入图片描述

流式大数据处理

数据特点：动态数据；数据在计算过程中，不断更新，无法预先把数据保存
场景：在线计算，对实时性要求高
代表技术：storm

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

大规模图处理

数据特点：比较重要，普遍存在生活中的数据，如交通网，社交网数据
代表技术：pregel

在这里插入图片描述

研究物体与物体的关系

在这里插入图片描述

在这里插入图片描述

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。