实例中看一个map、reduce过程

最新推荐文章于 2022-07-26 00:51:59 发布

一棵大树Atree

最新推荐文章于 2022-07-26 00:51:59 发布

阅读量243

点赞数

分类专栏：项目例化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/FengqiangDu/article/details/91366071

版权

项目例化专栏收录该内容

1 篇文章 0 订阅

订阅专栏

项目中有约9TB的数据（网络日志、图片），以及10个MapReduce服务器节点。

第一步是使用简单的文件复制过程，为每个服务器节点分配一定量的数据（自己划分）。注意，这些数据须在MapReduce过程开始前被分配好。且文件的格式由自己决定，没有类似于关系型数据库中的标准格式。

接下来，向调度程序提交两个程序：映射程序（map）和归约程序（reduce）。在这两步骤过程中，map在磁盘上找到数据，然后就执行它包含的逻辑。这个过程是在10台服务器上的每一台单独发生的。然后映射步骤的结果被传递到归约过程中（在这之前还会进一步的清洗（shuffle）、排序（sort）），归约程序总结并汇总所有的答案（自己想要的数据）。

一棵大树Atree

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
实例中看一个map、reduce过程

项目中有约9TB的数据（网络日志、图片），以及10个MapReduce服务器节点。第一步是使用简单的文件复制过程，为每个服务器节点分配一定量的数据（自己划分）。注意，这些数据须在MapReduce过程开始前被分配好。且文件的格式由自己决定，没有类似于关系型数据库中的标准格式。接下来，向调度程序提交两个程序：映射程序（map）和归约程序（reduce）。在这两步骤过程中，map在磁盘上找到数...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。