Terasort介绍
Terasort是hadoop自带的性能测试方法,能够使用Terasort生成数据并进行排序
问题出现
hadoop jar hadoop-mapreduce-examples-3.3.1.jar terasort input2GB output2GB
执行命令报错
问题分析
ERROR terasort.TeraSort: Requested replication factor of 10 exceeds maximum of 3 for output2GB/_partition.lst, clientName=10.250.122.32
原因是hdfs的副本最大数为3,需要10
问题解决
hdfs-site.xml中参数dfs.replication.max设置为10
重启hdfs解决