hadoop map数量太少的问题

最新推荐文章于 2022-10-20 10:54:04 发布

poson

最新推荐文章于 2022-10-20 10:54:04 发布

阅读量1.8k

点赞数

分类专栏：互联网 hadoop 文章标签： hadoop exception output string input

本文链接：https://blog.csdn.net/poson/article/details/7448214

版权

互联网同时被 2 个专栏收录

30 篇文章 0 订阅

订阅专栏

hadoop

5 篇文章 0 订阅

订阅专栏

某些时候map的数量太少，但是每个map的文件比较大，导致执行时间很长。为了充分利用hadoop的优势，我们把map的数据hash到更多的reduce节点去做处理。

使用随机数据都不是特别好，更好的方式是使用input line的hashCode。

public void map(LongWritable key, Text value,
OutputCollector<Text, Text> output, Reporter reporter)
throws IOException
{
   try
   {
String line = value.toString();
rand=line.hashCode();
x.set(rand.toString());
y.set(line);
output.collect(x,y);


   } catch (Exception e)
   {
reporter.incrCounter("map", "exp", 1);
   }
}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

poson

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop map数量太少的问题

某些时候map的数量太少，但是每个map的文件比较大，导致执行时间很长。为了充分利用hadoop的优势，我们把map的数据hash到更多的reduce节点去做处理。使用随机数据都不是特别好，更好的方式是使用input line的hashCode。public void map(LongWritable key, Text value,OutputCollector outpu
复制链接

扫一扫