Hadoop-HDFS的常用shell操作

HDFS的Shell操作

基本语法:

hadoop fs 具体命令
# 或者是
hdfs dfs 具体命令

## 其中hdfs是hadoop的子组件,而dfs是fs的实现类
## 其中HDFS中保存的文件的本地路径大致是以下位置(以113为例)
/opt/module/hadoop-2.7.2/data/tmp/dfs/data/current/BP-1284647261-10.10.10.113-1622790151545/current/finalized/subdir0/subdir0

查看能够使用的命令

hadoop fs

## 结果如下:
[bd@hadoop113 hadoop-2.7.2]$ hadoop fs 
Usage: hadoop fs [generic options]
        [-appendToFile <localsrc> ... <dst>]
        [-cat [-ignoreCrc] <src> ...]
        [-checksum <src> ...]
        [-chgrp [-R] GROUP PATH...]
        [-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]
        [-chown [-R] [OWNER][:[GROUP]] PATH...]
        [-copyFromLocal [-f] [-p] [-l] <localsrc> ... <dst>]
        [-copyToLocal [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
        [-count [-q] [-h] <path> ...]
        [-cp [-f] [-p | -p[topax]] <src> ... <dst>]
        [-createSnapshot <snapshotDir> [<snapshotName>]]
        [-deleteSnapshot <snapshotDir> <snapshotName>]
        [-df [-h] [<path> ...]]
        [-du [-s] [-h] <path> ...]
        [-expunge]
        [-find <path> ... <expression> ...]
        [-get [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
        [-getfacl [-R] <path>]
        [-getfattr [-R] {-n name | -d} [-e en] <path>]
        [-getmerge [-nl] <src> <localdst>]
        [-help [cmd ...]]
        [-ls [-d] [-h] [-R] [<path> ...]]
        [-mkdir [-p] <path> ...]
        [-moveFromLocal <localsrc> ... <dst>]
        [-moveToLocal <src> <localdst>]
        [-mv <src> ... <dst>]
        [-put [-f] [-p] [-l] <localsrc> ... <dst>]
        [-renameSnapshot <snapshotDir> <oldName> <newName>]
        [-rm [-f] [-r|-R] [-skipTrash] <src> ...]
        [-rmdir [--ignore-fail-on-non-empty] <dir> ...]
        [-setfacl [-R] [{-b|-k} {-m|-x <acl_spec>} <path>]|[--set <acl_spec> <path>]]
        [-setfattr {-n name [-v value] | -x name} <path>]
        [-setrep [-R] [-w] <rep> <path> ...]
        [-stat [format] <path> ...]
        [-tail [-f] <file>]
        [-test -[defsz] <path>]
        [-text [-ignoreCrc] <src> ...]
        [-touchz <path> ...]
        [-truncate [-w] <length> <path> ...]
        [-usage [cmd ...]]

Generic options supported are
-conf <configuration file>     specify an application configuration file
-D <property=value>            use value for given property
-fs <local|namenode:port>      specify a namenode
-jt <local|resourcemanager:port>    specify a ResourceManager
-files <comma separated list of files>    specify comma separated files to be copied to the map reduce cluster
-libjars <comma separated list of jars>    specify comma separated jar files to include in the classpath.
-archives <comma separated list of archives>    specify comma separated archives to be unarchived on the compute machines.

The general command line syntax is
bin/hadoop command [genericOptions] [commandOptions]

命令的使用:

## -help:输出命令的使用方法
hadoop fs -help rm

## -ls:显示目录信息
hadoop fs -ls /
### -lsr:递归显示目录信息
hadoop fs -lsr /

## -makdir:创建目录
hadoop fs -mkdir -p /sanguo/wei

## -moveFromLocal:从本地剪切粘贴到HDFS
hadoop fs -moveFromLocal /opt/module/testData/caocao /sanguo/wei/

## -appendToFile:追加一个文件到已经存在的文件末尾,此时会将追加的文件的内容存放到被追加的文件末尾
hadoop fs -appendToFile /opt/module/testData/liubei /sanguo/wei/caocao

## -cat:显示文件内容,这里查看caocao的话可以看到liubei的内容也在caocao了
hadoop fs -cat /sanguo/wei/caocao

## -chgrp:修改组
## -chmod:修改权限
## -chown:修改拥有者
## 与Linux文件系统中的用法一样
hadoop fs -chgrp bd /sanguo/wei/caocao
hadoop fs -chmod 777 /sanguo/wei/caocao

## -copyFromLocal:从本地文件系统中拷贝文件到 HDFS 路径去
touch zhenji
hadoop fs -copyFromLocal ./zhenji /sanguo/wei/

## -copyToLocal:从 HDFS 拷贝到本地
hadoop fs -copyToLocal /sanguo/wei/zhenji .

## -cp :从 HDFS 的一个路径拷贝到 HDFS 的另一个路径
hadoop fs -cp /sanguo/wei/zhenji /sanguo/

## -cp :从 HDFS 的一个路径拷贝到 HDFS 的另一个路径
hadoop fs -mv /sanguo/zhenji /

## -get:等同于 copyToLocal,就是从 HDFS 下载文件到本地
hadoop fs -get /zhenji .

## -getmerge:合并下载多个文件,比如 HDFS 的目录 /sanguo/wei下有多个文件:caocao、zhenfu
hadoop fs -getmerge /sanguo/wei ./wei.txt

## -put:等同于 copyFromLocal
hadoop fs -put LICENSE.txt /sanguo/wei/

## -tail:显示一个文件的末尾
hadoop fs -tail /sanguo/wei/LICENSE.txt

## -rm:删除文件或文件夹
hadoop fs -rm /sanguo/wei/LICENSE.txt

## -rmdir:删除空目录
hadoop fs -mkdir /test
hadoop fs -rmdir /test

## -du 统计文件夹的大小信息
### 查看目录下各个文件夹的大小
hadoop fs -du -h /
### 查看目录文件夹大小
hadoop fs -du -h -s /

## -setrep:设置 HDFS 中文件的副本数量 set replication
## 现在默认是3
## 设置副本数为2,那么将会有一台服务器中的副本被删除
## 可以从目录data/tmp/dfs/data/current/BP-1284647261-10.10.10.113-1622790151545/current/finalized/subdir0/subdir0
hadoop fs -setrep 2 /sanguo/wei/zhenji

## 设置副本数为10,这里设置的副本数只是记录在 NameNode 的元数据中,是否真的会有这么多副本,还得看 DataNode 的数量。因为目前只有 3 台设备,最多也就 3 个副本,只有节点数的增加到 10台时,副本数才能达到 10。
hadoop fs -setrep 10 /sanguo/wei/zhenji

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值