hdfs是hadoop的核心,是hadoop可以本地计算的基础,命令行操作是应该具备的基本能力。
总结:
- 命令入口是:hadoop fs 。即都是以此开头,实质是/bin/hadoop.cmd,fs是功能分支,对应org.apache.hadoop.fs.FsShell。fs同级的还有jar、version等。
- 大多命令与linux相同,如ls、cat、tail、rm等
- 与linux不同的,必须指定执行目录。如 hadoop fs -ls / linux直接ls,应为登入后有基本目录。
- hadoop fs 可以查看支持的命令。
常用操作
功能 | 示例 | 备注 |
---|---|---|
创建目录 | hadoop fs -mkdir /books | |
文件上传 | hadoop fs -copyFromLocal /f:/hadoop-2.7.4/input/changes.txt /books/changes.txt | 本地磁盘名要以/开头 |
文件上传 | hadoop fs -copyFromLocal ./input/changes.txt /books/nodejs | 本地路径是当前命令行路径,不是hadoop命令的路径。 |
文件上传2 | hadoop fs -put ./input/changes.txt /books/nodejs | eg:如果命令行在F:\,则为F:\input;命令行在F:\hadoop-2.7.4,则为F:/hadoop-2.7.4/input |
文件下载 | hadoop fs -copyToLocal _hdfsSrc _localDest | |
文件下载2 | hadoop fs -get _hdfsSrc _localDest | |
读 | get | |
写 | put | |
删 | hadoop fs -rm _hdfsFile | |
删目录 | hadoop fs -rm -r _hdfsDir | |
改 | ||
查 | hadoop fs -find /books *.txt | |
文件大小 | du | 统计路径下文件夹和文件大小。 |
文件个数 | count | 统计路径下目录个数、文件个数、大小 |
设置副本 | setrep | set replication |
状态 | stat | 显示目录或文件状态,需要手工设置显示内容; |
查看内容 | tail | 显示默认1k内容。 |
压缩 | archive | 压缩文件 eg:hadoop archive -archiveName hadoop.har -p /user 1.txt 2.txt /des |
手工均衡 | hdfs balancer | 数据均衡分布。 |
distcp | 2个hdfs直接拷贝数据。 | |
hdfs管理 | hdfs dfsadmin -help。 |