一文带你了解HDFS的shell命令

1 准备知识

HDFS:hadoop集群分布式文件系统,用来存储海量数据。HDFS采用分而治之的设计思想,将文件切分为文件块进行存储,存储数据的节点为datanode,存储这些数据具体存放位置的节点为namenode。HDFS的架构为一主多从,即namenode为主,datanade为从。本文主要介绍HDFS的shell命令,即如何通过命令行对HDFS进行操作。

首先附上官网链接,HDFS Commands Guide

介绍HDFS之前,需要了解一下命令行的格式,找个例子讲一下。

hadoop fs [generic options]
        [-appendToFile <localsrc> ... <dst>]
        [-cat [-ignoreCrc] <src> ...]
        [-getfattr [-R] {-n name | -d} [-e en] <path>]

命令行中符号的含义如下表:

[]可选内容
<>必选内容
{}分组
|二选一
同一个内容可多次出现
-后面连接单个字符,可多个组合使用
--后面跟完整的单词
Localsrc本地源文件
dst目标路径

参考上述,可写如下命令:

hadoop fs -appendToFile <localsrc> ...<dst>
或者
hadoop fs -getfattr -d <path> 

2 shell命令

查看hdfs命令的方式,直接在hadoop集群上输入hdfs,会输出usage(用法)。

image-20201029235429389

hdfs的命令分为三种,分别是admin command(管理员)、client commands(客户端)和 Daemon Command(进程)

管理员命令客户端命令进程命令
cacheadminclasspathbalancer
cryptodfsdatanode
debugenvvarsdfsrouter
dfsadminfetchdtdiskbalancer
dfsrouteradmingetconfhttpfs
ecgroupsjournalnode
fscklsSnapshottableDirmover
haadminsnapshotDiffnamenode
jmxgetversionnfs3
oevportmap
oivsecondarynamenode
oiv_legacyspser
storagepolicieszkfc

2.1 admin command

管理员命令主要介绍 dfsadmin和fsck

输入 hdfs dfsadmin 查看usage

image-20201101154135078

  • hdfs dfsadmin -report #报告集群状态

image-20201101155907376

  • hdfs dfsadmin -safemode #设置集群的安全模式,当集群出现问题时,可设置安全模式。enter :进入安全模式,安全模式状态下,不可以向hdfs上传输文件;leave:离开;get:获取当前状态;wait:等待。

image-20201101160837460

  • hdfs dfsadmin -allowSnapShot #启用快照功能,快照功能开启,就可以对文件进行备份了。

输入hdfs fsck 查看fsck的usage:

image-20201101181624043

  • hdfs fsck / #查看hdfs文件系统信息

2.2 client commands

客户端命令介绍dfs、getconf和version

输入 hdfs dfs 查看dfs的usage

image-20201101182622112

每个具体子命令的含义如下表

appendToFile追加一个或者多个文件到hdfs指定文件中
cat显示文件内容到标准输出上
checksum校验和
chgrp修改所属组
chmodhdfs上文件用户名和用户组
chownhdfs上文件权限修改
copyFromLocal从本地复制文件到hdfs文件系统
copyToLocal复制hdfs文件系统中的文件到本地
count统计与指定文件模式匹配的路径下的目录,文件和字节数
cp将文件或目录复制到目标路径下
createSnapshot创建快照
deleteSnapshot删除快照
df查看可用空间
du显示给定目录中包含的文件和目录的大小或文件的长度,用字节大小表示。
expunge清空回收站
find查找
get将本地文件从HDFS下载到本地
getfacl显示权限信息
getfattr显示其他信息
getmerge将源目录和目标文件作为输入,并将src中的文件连接到目标本地文件
head输出文件开头10行
help帮助信息
ls查看目录下内容
mkdir创建目录
moveFromLocal从本地移动到hdfs
moveToLocal移动到本地
mv将文件或目录从HDFS的源路径移动到目标路径
put将本地文件上传到HDFS
renameSnapshot重命名快照
rm删除一个文件或目录
rmdir删除空目录
setfacl设置权限
setfattr其他信息
setrep修改副本数
stat显示文件所占块数(%b)
tail显示文件的最后1kb内容到标准输出
test某个文件或者目录是否存在
text获取源文件并以文本格式输出文件
touch创建一个零长度的文件
touchz目录创建一个新文件
truncate截断
usage返回命令的help信息。

输入 hdfs getconf 查看getconf的usage

image-20201101184223100

  • hdfs getconf -namenodes #查看namenode的节点名称

image-20201101184546733

  • hdfs getconf -nnRpcAddresses #查看namenode的RPC地址

    image-20201101184809272

输入hdfs version查看hsdf的版本信息

image-20201101184949452

2.3 Daemon Command

  • hdfs balancer # 启动datanode的均衡分布

  • hdfs datanode #查看datanode进程

  • hdfs namenode #查看namenode进程

    namenode后也可跟参数,具体如下

 hdfs nameNode
                  [-format]      //格式化NameNode
                  [-upgrade]   //在Hadoop升级后,应该使用这个命令启动NameNode
                  [-rollback]    //使用NameNode回滚前一个版本
                  [-finalize]     //删除文件系统的前一个状态,这会导致系统不能回滚到前一个zhua
                  [-importCheckpoint]    // 复制备份checkpoint的状态到当前checkpoint

至此,hdfs的shell命令算是简单的过了一遍,有兴趣的可以每个命令具体去实操一下。

文章持续更新,可以微信搜索「 大数据分析师知识分享」第一时间阅读,回复【666】获取大数据相关资料。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: HDFS Shell是Hadoop分布式文件系统(HDFS)的命令行接口。以下是一些HDFS Shell命令的例子: 1. 查看HDFS文件系统的根目录: ``` hadoop fs -ls / ``` 2. 在HDFS文件系统中创建一个目录: ``` hadoop fs -mkdir /mydirectory ``` 3. 将本地文件上传到HDFS文件系统中的目录中: ``` hadoop fs -put /local/path/to/file /hdfs/path/to/directory ``` 4. 从HDFS文件系统中下载文件到本地: ``` hadoop fs -get /hdfs/path/to/file /local/path/to/file ``` 5. 删除HDFS文件系统中的文件或目录: ``` hadoop fs -rm /hdfs/path/to/file hadoop fs -rm -r /hdfs/path/to/directory ``` 6. 在HDFS文件系统中复制文件或目录: ``` hadoop fs -cp /hdfs/path/to/source /hdfs/path/to/destination ``` 7. 查看HDFS文件系统中文件或目录的内容: ``` hadoop fs -cat /hdfs/path/to/file hadoop fs -tail /hdfs/path/to/file ``` 以上只是一些常用的HDFS Shell命令,还有许多其他命令可以使用。 ### 回答2: HDFS Shell命令是在Hadoop分布式文件系统(HDFS)中使用的命令行界面工具。它提供了一种方便直接访问和操作HDFS的方法,可以在终端或命令行中执行。 HDFS Shell命令通常以"hadoop fs"或"hdfs dfs"作为前缀,后跟具体的命令和参数。它们可以用于创建、复制、删除、移动和查看文件和目录等操作。 以下是一些常用的HDFS Shell命令及其功能: - "ls":列出指定路径下的所有文件和目录。 - "mkdir":创建一个新的目录。 - "copyFromLocal":从本地文件系统复制文件到HDFS。 - "copyToLocal":将HDFS上的文件复制到本地文件系统。 - "mv":移动或重命名文件或目录。 - "rm":删除指定的文件或目录。 - "cat":显示文件的内容。 - "put":将本地文件复制到指定路径下。 - "get":将指定路径下的文件复制到本地文件系统。 - "chmod":更改文件或目录的权限。 - "chown":更改文件或目录的所有者。 - "chgrp":更改文件或目录的组。 - "du":显示指定路径下的文件和目录的大小。 HDFS Shell命令是Hadoop生态系统中重要的一部分,可以方便地进行文件系统的操作。它也可以与其他Hadoop工具和组件集成,如MapReduce、Hive和Spark等,来进行更复杂的数据处理和分析工作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值