在工作中最常用的就是使用hdfs提供的命令:
使用hadoop fs -help 就能显示出所有的命令,并将其参数和用途显示出来。
hadoop命令可以直接当做是shell命令,其结果也可以使用shell命令进行操作,比如使用awk进行一些简单的统计。
将hadoop fs -help的结果显示出来的所有命令熟悉以后,基本上日常的一些基本操作都能满足。
需要注意的是hadoop的fs,dfs,和 hdfs dfs 这三者的区别。
hadoop fs:使用面最广,可以操作任何文件系统。
hadoop dfs与 hdfs dfs:只能操作HDFS文件系统相关(包括与Local FS间的操作),前者已经Deprecated,一般使用后者。