cloudea 大数据实验平台安装好了,做点什么呢? 还是从hello world开始吧
1. 查看hadoop版本
root@cdh01:~# hadoop version如果能如上正常显示,说明可以使用hadoop测试程序了
2. 查看有哪些测试程序可用
root@cdh01:~# hadoop jar /opt/cloudera/parcels/CDH/jars/hadoop-examples.jar
运行该程序会介绍有哪些hadoop测试程序可以使用
aggregatewordcount 计算输入文件中文字个数的基于聚合的MapReduce程序。
aggregatewordhist 生成输入文件中文字个数的统计图的基于聚合的MapReduce程序。
grep 计算输入文件中匹配正则表达式的文字个数的MapReduce程序。
join 合并排序的平均分割的数据集的作业。
multifilewc 计算几个文件的文字个数的作业。
pentomino 解决五格拼版问题的分块分层的MapReduce程序。
pi 使用蒙地卡罗法计算PI的MapReduce程序。
randomtextwriter 在一个节点上写10G随机文本的MapReduce程序。
randomwriter 在每个节点上写10G随机数据的MapReduce程序。
sleep 在每个Map和Reduce作业中休憩的程序。
sort 排序随机写入器生成的数据的M