1.启动HDFS和yarn
$HADOOP_HOME/sbin/start-dfs.sh
$HADOOP_HOME/sbin/start-yarn.sh
2. 数据准备
进入$HADOOP_HOME目录
cd $HADOOP_HOME
创建数据文件
vi intput1.txt
输入如下内容
hello bigdata 2017
hello bigdata 2018
hello bigdata 2019
hello bigdata 2020
hello ynnu 2017
hello ynnu 2018
hello ynnu 2019
hello ynnu 2020
使用同样的方式创建文件input2.txt
3.HDFS上创建目录
在HDFS根目录下创建文件夹test
hdfs dfs -mkdir /test
在 /test目录下创建文件夹input
hdfs dfs -mkdir