前言:
在第1课,我们已经成功安装了Hadoop,下面来测试一下Hadoop统计分析数据的功能。
1、在/home/sa/file下面分别创建 file1.txt 和 file2.txt 两个文件
file1.txt 的内容:
What's your name
My name is Li Ming
file2.txt的内容:
How are you
My dear friend
2、我们启动Hadoop后,在HDFS数据库中创建目录/input2
cd ~/hadoop
bin/hadoop fs -mkdir /input2
3、将file1.txt和file2.txt文件保存到HDFS数据库中
bin/hadoop fs -put ~/file/file*.txt /input2/
4、查看HDFS数据库中是否已经存在file1.txt、file2.txt
bin/hadoop fs -ls /input2
5、运行包命令“hadoop jar ×××.jar“,执行WordCount程序,来分析统计数据
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar wordcount /input2/ /output2/wordcount1
6、分析统计完成后,来查看一下输出目录中的所有结果:
bin/hadoop fs -cat /output2/wordcount1/*