一. 验证hadoop的hdfs文件系统功能是否正常
安装好Hadoop后,其hdfs文件系统是空的。Hdfs实现文件的管理操作。此时,查看hdfs目录,将出现“cannot access …”错误。如下:
1. 从linux系统中将文件copy到hadoop的hdfs中。
首先,在linux系统中常见input(或file)文件夹,并在其中创建test1.txt和test2.txt(也可以创建多个),即:
接着,将这些文件上传到hdfs文件系统中,如下。
析:dfs程序带的一个参数,主要表示要操作的是dfs文件系统。-put表示要“上传”这个动作。./表示上传的源文件路径,该例中,表示要将file目录下的所有文件上传,所以是./。input表示上传文件的目的地址,即此时上传至hdfs的主目录下的input下。
显示hdfs文件系统目录:
显示input文件夹内容:
删除input文件夹: