Hadoop之MR的调优性能

最新推荐文章于 2021-04-20 19:47:39 发布

big_confidence

最新推荐文章于 2021-04-20 19:47:39 发布

阅读量1.7k

点赞数

分类专栏： hadoop 文章标签： mapreduce 调优 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liao272549164/article/details/40654425

版权

hadoop 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

在工作过程中遇到这样一个问题：就是在map的时候需要读取大概1T左右的数据，在用集群的本身的设置之外没有设置任何参数时发现就光map（纯粹就是一个转发函数）就要跑上两个小时。

都说让MR的分区块大小和Hadoop集群中的hdfs块大小一致，这样保证数据不出现跨网络的拷贝，其实也用不着一个MR的程序大小和hdfs块大小一致，因为从hdfs的数据存储的架构来看，其有很多的hdfs块是放在了同一个数据节点上的，这样如果我们调大MR的分区大小，我们就能连接好节点的其它数据块了，这样程序还是跑在了同一个节点上面（没有发生网络数据传输）。

所以，在调节MR的性能时，如果发现在map的读数据时时间不理想，可以调大mapred.min.split.size参数（jobConf.setInt("mapred.min.split.size", 512*1024*1024)）。多半时候这是有用的！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop之MR的调优性能

在工作过程中遇到这样一个问题：就是在map的时候xuyao
复制链接

扫一扫

专栏目录

big_confidence CSDN认证博客专家 CSDN认证企业博客

码龄16年

31: 原创

33万+: 周排名

185万+: 总排名

5万+: 访问

: 等级

862: 积分

8: 粉丝

13: 获赞

5: 评论

22: 收藏

私信

关注

热门文章

分类专栏

Opencv 3篇
C语言 2篇
杂记 4篇
图像处理 4篇
c++/c 6篇
学术研究 1篇
算法 1篇
Java学习 6篇
hadoop 5篇
负载均衡 1篇
nodejs 1篇

最新评论

关于变化检测中的遗传算法适应度值的质疑
膨胀的五百斤: 科学论文，起源于17世纪科学家之间的私人信件，早期的论文在某些方面比今天的论文更具有可读性。它们不那么专业，更直接，更短，也不那么正式，因此它们本来只是写给他人的信。现在的研究论文已经违背了科研的初衷，如今，科学越来越复杂，科学表达越来越难。今天的论文比以往任何时候都长，而且充满了行话和符号。它们依赖于计算机程序，进行生成数据、清理数据、绘制数据、运行模型。这些程序往往写得很混乱难懂，但是对结果又是如此重要，导致其他人很难复制出整个推导过程。
关于变化检测中的遗传算法适应度值的质疑
tt1024123: 你好，请问你的问题解决了吗？
spring Context initialization failed
四级四二三: 楼主我想问你下。。。只需要换安装包安好了改了环境变量就可以了么。。我们俩的错误是一模一样。。我的好像也是SPRING3.2和1.8不搭配。。结果重装了1.6又试了1.7都不可以。。。
spring Context initialization failed
四级四二三: 楼主我想问你下。。。只需要换安装包安好了改了环境变量就可以了么。。我们俩的错误是一模一样。。我的好像也是SPRING3.2和1.8不搭配。。结果重装了1.6又试了1.7都不可以。。。
LVS 之Direct Routing原理
big_confidence: 艹，这个csdn的编辑框怎么这么差劲啊，我写的时候调好了格式，发表出来就TM的乱了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。