Hadoop权威指南第四版学习笔记系列（第二章：关于Hadoop）

最新推荐文章于 2020-12-10 14:17:55 发布

能不能多喝一点热水

最新推荐文章于 2020-12-10 14:17:55 发布

阅读量145

点赞数

文章标签： Hadoop 学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34204503/article/details/101343558

版权

1.为了实现横向扩展，我们需要把数据存储在分布式文件系统中，通过使用Hadoop资源管理系统YARN，Hadoop可以将MapReduce计算转移到存储有不分数据的各台机器上。

2.map任务将其输出写入本地磁盘，而非HDFS。**

只是因为map的输出是中间结果：该中间结果由reduce任务处理完后才产生最终输出结果，而且一旦作业完成，map的输出结果就可以删除。因此，如果运行map任务的节点在将map中间结果传给reduce任务之前失败，Hadoop将在另一个节点上重新运行这个map任务以再次构建map中间结果。

3.reduce的输出通常存储在HDFS中以实现可靠存储。

能不能多喝一点热水

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop权威指南第四版学习笔记系列（第二章：关于Hadoop）

1.为了实现横向扩展，我们需要把数据存储在分布式文件系统中，通过使用Hadoop资源管理系统YARN，Hadoop可以将MapReduce计算转移到存储有不分数据的各台机器上。2.map任务将其输出写入本地磁盘，而非HDFS。**只是因为map的输出是中间结果：该中间结果由reduce任务处理完后才产生最终输出结果，而且一旦作业完成，map的输出结果就可以删除。因此，如果运行map任务的节点在...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。