题目:求每个订单中最贵的商品(GroupingComparator)
我将该数据源上次至hadoop集群中,随后调用编写好的MapReduce程序,结果报错如下:20/12/19 12:18:08 INFO mapreduce.Job: Task Id : attempt_1607842602362_0032_m_000000_2, Status : FAIL
解决流程:
我检查了一下数据源文件,我将数据源存放在一个Grouping.txt文件中,该数据源如下:
随后我把该文件上传至集群,作为调用MapReduce程序的数据源
然后调用MapReduce程序运行结果如下:
提示错误:20/12/19 12:40:31 INFO mapreduce.Job: Task Id : attempt_1607842602362_0034_m_000000_0, Status : FAILED
同时还报出下标越界 ArrayIndexOutOfBoundsException
解决方法:
我查看了该数据源发现,数据源居然存在一个空行
随后我将该“空行”删除,重新另存为一个新文件
将新文件重新上传至集群
调用MapReduce程序,该程序的数据源为删除“空行”后的新数据源
Hadoop调用MapReduce程序成功
总结:
1.调用MapReduce程序时的数据源,要注意空行空格