HDFS的Shell操作操作

3.4 HDFS的Shell操作操作

3.4.1 基础语法

HDFS Shell命令是由一系列类似Linux Shell的命令组成的。命令大致可分为操作命令、管理命令、其他命令三类。

  • 操作命令:操作命令是以"hdfs dfs"开头的命令。通过这些命令可以完成HDFS文件的复制、删除和查找等操作。Shell命令的一般格式如下:
hdfs dfs [通用选项]
或
hadoop fs  [通用选项]

其中hdfs是Hadoop系统在Linux系统中的主命令;dfs是子命令,表示执行文件操作;通用选项由HDFS文件操作命令和操作参数组成。hadoop fs 具体命令 或者 hdfs dfs 具体命令两种写法完全相同。

  • 管理命令:管理命令是以"hdfs dfsadmin"开头的命令。通过这些命令,用户可以管理HDFS。管理命令的一般格式如下:
hdfs dfsadmin [通用选项]

其中hdfs是Hadoop系统在Linux系统中的主命令;dfsadmin是子命令,表示执行文件系统管理的操作;通用选项由HDFS管理命令和参数组成

  • 其他命令:把操纵命令"hdfs dfs"、管理命令"hdfs dfsadmin"之外的命令称为其他命令。

3.4.2 文件操作命令

常用的HDFS Shell命令

命令功能
-help [cmd]显示命令的帮助信息
-ls® <path>显示当前目录下所有文件
-du(s) <path>显示目录中所有文件的大小
-count[-q] <path>显示目录中文件数量
-mv <src> <dst>移动多个文件到目标目录
-cp <src> <dst>复制多个文件到目标目录
-rm®删除文件(夹)
-put <localsrc> <dst>本地文件复制到hdfs
-copyFromLocal与put相同
-moveFromLocal从本地文件移动到hdfs
-get [-ignoreCrc] <src> <localdst>复制文件到本地,可以忽略crc校验
-getmerge <src> <localdst>将源目录中的所有文件排序合并到一个文件中
-cat <src>在终端显示文件内容
-text <src>在终端显示文件内容
-copyToLocal [-ignoreCrc] <src> <localdst>复制到本地
-moveToLocal <src> <localdst>移动到本地
-mkdir <path>创建文件夹
-touchz <path>创建一个空文件

使用fs命令可以查看以上命令

[li@hadoop102 bin]$ hadoop fs

HDFS命令的官方文档地址:
https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/FileSystemShell.html

3.4.3 常用文件操作命令

  1. -touch

功能:创建文件,更新修改文件的时间
格式:hadoop fs -touch [-a] [-m] [-t TIMESTAMP] [-c] URI [URI …]
例:在hdfs上创建文件,更新文件修改的时间

hadoop fs -touch pathname
hadoop fs -touch -m -t 20180809:230000 pathname
hadoop fs -touch -t 20180809:230000 pathname
hadoop fs -touch -a pathname
  1. -help

功能:输出这个命令参数
格式:hadoop fs -help
例:查看rm命令的帮助文档

[@hadoop102 hadoop-3.1.3]$ hadoop fs -help rm
  1. -mkdir

功能:接收路径指定的URI作为参数,创建目录。
格式:hadoop fs -mkdir [-p] <paths>
例:在hdfs上创建目录school

[li@hadoop102 hadoop-3.1.3]$ hadoop fs -mkdir /school
  1. -moveFromLocal

功能:移动本地文件到hdfs指定目录上。
格式:-moveFromLocal <localsrc> <dst>
例:将本地文件/home/sclang/test.txt移动到hdfs的/input文件夹中

hdfs dfs -moveFromLocal /home/sclang/test.txt /input
  1. -copyFromLocal

功能:复制本地文件到hdfs指定目录上。
格式:hdfs dfs -copyFromLocal [-f] [-p] [-l] [ -d] [-t <thread count>] <localsrc> <dst>
例:将本地文件/home/sclang/test.txt文件复制HDFS的/hadoop文件中。

hdfs dfs -copyFromLocal /home/sclang /hadoop
  1. -copyToLocal

功能:复制hdfs文件到本地主机指定目录上。
格式:-copyToLocal [-f] [-p] [-ignoreCrc] [-crc] <src> <localdst>
例:将hdfs文件/hadoop/test.txt文件复制到本地/home/sclang文件中。

hdfs dfs -copyToLocal /hadoop/test.txt /home/sclang
  1. -put

功能:将单个或多个文件上传到指定的HDFS系统目录中去
格式:-put [-f] [-p] [-l] [-d] <localsrc> <dst>
例:将/home/sclang/file.txt文件上传到/hadoop文件夹中

hdfs dfs -put /home/sclang/file.txt /hadoop
  1. -appendToFile

使用方法:hadoop fs -appendToFile <localsrc> …<dst>
追加一个文件到已经存在的文件末尾

  1. -get

功能:将HDFS文件复制到本地系统指定目录。
格式:hdfs dfs -get [-f] [-p] [-ignoreCrc] [-crc] <src> <localdst>
例:将/hadoop/test.txt文件复制到本地/home/sclang文件中。

hdfs dfs -get /hadoop/test.txt /home/sclang
  1. -ls

功能:显示指定目录下的所有文件。
格式:hdfs dfs -ls <path>
例:显示/input目录下的所有文件

hdfs dfs -ls /input

lsr是ls命令的递归版本,会递归列出子目录中的文件及目录信息

  1. -cat

功能:在屏幕终端打印指定文件内容。
格式:hdfs dfs -cat <src>
例:查看/hadoop下的test.txt文件

hdfs dfs -cat /hadoop/test.txt
  1. -chgrp

功能:更改指定文件的所属组。
格式:hdfs dfs -chgrp [-R] <group> <path>
例:将/hadoop文件夹及以内的所有文件的所属组改为sclang

hdfs dfs -chgrp -R sclang /hadoop
  1. -chmod

功能:更改指定文件的权限。改变文件的权限。使用-R将使改变在目录结构下递归进行。命令的使用者必须是文件的所有者或者超级用户。
格式:hdfs dfs -chmod [-R] <MODE[,MODE]…|OCTALMODE> <path>
例:让所有人对/input/word.txt文件有执行权限

hdfs dfs -chmod +x /input/word.txt
  1. -chown

功能:更改指定文件的所属主与所属组。
格式:hdfs dfs -chown [-R] <user>:<group> <path>
例:将/hadoop/test.txt文件的属主改为root,属组改为root

hdfs dfs -chown root:root /hadoop/test.txt
  1. -cp

功能:复制文件到指定目录上。将文件从源路径复制到目标路径。这个命令允许有多个源路径,此时目标路径必须是一个目录。(从HDFS的一个路径拷贝到HDFS的另一个路径)
格式:hdfs dfs -cp [-f] [-p | -p[topax]] [-d] <src> <dst>
例:将本地文件/home/sclang/test.txt文件复制HDFS的/hadoop文件中。

hdfs dfs -cp /home/sclang /hadoop
  1. -mv

功能:将指定文件移动到指定目录下。在HDFS目录中将文件源路径移动到目标路径。这个命令允许有多个源路径,此时目标路径必须是一个目录。不允许在不同的文件系统间移动文件。
格式:-mv <src> <dst>
例:将/input/test.txt文件移动到/tmp文件中

hdfs dfs -mv /input/test.txt /tmp
  1. -tail

功能:默认查看指定文件的后10行
格式:hdfs dfs -tail <file>
例:查看/hadoop/test.txt文件的前10行内容

hdfs dfs -tail /hadoop/test.txt
  1. -rm

功能:删除指定的文件。
格式:hdfs dfs -rm [-r|-R] [-f] <path>
例:删除/hadoop下的test.txt文件

hdfs dfs -rm -r -f /hadoop/test.txt
  1. -du

功能:显示目录中所有文件的大小,或者当只指定一个文件时,显示此文件的大小。
格式:hadoop fs -du [-s] [-h] [-v] [-x] URI [URI …]

hdfs dfs -du /hadoop/test.txt
  1. -setrep

功能:设置HDFS中文件的副本数量,-R选项用于递归改变目录下所有文件的副本系数。
格式:hadoop fs -setrep [-R] [-w] <numReplicas> <path>

$ hadoop fs -setrep 10 /jinguo/shuguo.txt

这里设置的副本数只是记录在NameNode的元数据中,是否真的会有这么多副本,还得看DataNode的数量。因为目前只有3台设备,最多也就3个副本,只有节点数的增加到10台时,副本数才能达到10。

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: HDFS Shell是Hadoop分布式文件系统中的命令行工具,用于管理HDFS中的文件和目录。以下是HDFS Shell常用的一些操作: 1. 列出目录中的文件和子目录:`hdfs dfs -ls <目录路径>` 2. 创建目录:`hdfs dfs -mkdir <目录路径>` 3. 删除目录:`hdfs dfs -rm -r <目录路径>` 4. 上传本地文件到HDFS:`hdfs dfs -put <本地文件路径> <HDFS目录路径>` 5. 下载HDFS文件到本地:`hdfs dfs -get <HDFS文件路径> <本地目录路径>` 6. 合并HDFS文件到本地:`hdfs dfs -getmerge <HDFS目录路径> <本地文件路径>` 7. 复制文件:`hdfs dfs -cp <源文件路径> <目标文件路径>` 8. 移动文件:`hdfs dfs -mv <源文件路径> <目标文件路径>` 9. 查看文件内容:`hdfs dfs -cat <文件路径>` 10. 修改文件权限:`hdfs dfs -chmod <权限> <文件路径>` 以上是HDFS Shell的一些常用操作,可以帮助用户管理Hadoop分布式文件系统中的文件和目录。 ### 回答2: Hadoop分布式文件系统(Hadoop Distributed File System,简称HDFS)是Apache Hadoop的核心组件之一,用于存储和处理大规模数据集。HDFS Shell是Hadoop提供的基于命令行的操作工具,用于执行文件系统的管理操作HDFS Shell主要提供以下操作: 1. 文件和目录操作: - ls:列出指定目录下的内容。 - mkdir:创建一个新目录。 - rm:删除指定文件或目录。 - mv:将文件或目录移动到新位置。 - chmod:修改文件或目录的权限设置。 2. 文件上传和下载: - put:上传本地文件到HDFS。 - get:将HDFS上的文件下载到本地。 3. HDFS中的文件操作: - cat:打印文件内容。 - tail:打印文件的结尾部分。 - head:打印文件的开头部分。 - du:计算文件或目录的大小。 - count:统计指定目录下文件以及目录的个数。 - checksum:计算文件内容的检验和。 4. 其他操作: - help:列出所有可用命令。 - usage:显示指定命令的使用方法信息。 - exit:退出HDFS Shell。 使用HDFS Shell进行操作时,可以根据需要选择合适的命令来执行对应的操作。例如,使用ls命令可以列出指定目录下的文件和子目录,使用put命令可以上传本地文件到HDFS,使用cat命令可以打印指定文件的内容等。 HDFS Shell操作也可以通过Shell脚本来批量执行,可以更加方便地进行文件系统管理。总的来说,HDFS Shell是一种方便、高效的文件系统操作工具,对于Hadoop用户来说是必不可少的。 ### 回答3: HDFS(Hadoop 分布式文件系统)是一个由 Apache Hadoop 提供的分布式文件存储系统。HDFS ShellHDFS 文件系统的命令行接口,可以通过命令行终端进行 HDFS 文件系统的操作,实现文件的上传、下载、创建等。 HDFS Shell 使用方式如下: 1. 进入 Hadoop 环境,输入命令`hdfs dfs`或`hadoop fs`后,就可以使用 HDFS Shell。 2. 命令格式: ``` hadoop fs [通用选项] [-D <属性>=<值>] <命令> [命令选项] ``` 表示 HDFS Shell 包含的通用选项、属性选项,以及命令和命令选项。 其中,通用选项包括 `-conf`、`-D`、`-fs`、`-jt` 等,这些选项在 Hadoop 的其他模块中也可以使用。 命令包括 `cat`、`cp`、`count`、`get`、`ls`、`mkdir`、`mv`、`put`、`rm`、`rmdir` 等。 命令选项包括 `-skipTrash`、`-skipChecksum`、`-overwrite`、`-recursive` 等。 3. HDFS Shell 常用命令: `ls`:显示 HDFS 目录下的文件和目录。 `mkdir`:在 HDFS 中创建一个新的目录。 `put`:将本地文件或目录上传到 HDFS 文件系统。 `get`:将 HDFS 文件系统中的文件或目录下载到本地。 `rm`:删除 HDFS 文件系统中的文件或目录。 `mv`:将 HDFS 文件系统中的文件或目录移动到另一个位置。 4. HDFS Shell 实例: `hdfs dfs -ls /`:列出 HDFS 根目录下的文件和目录。 `hdfs dfs -mkdir /test`:在 HDFS 中创建一个名为 test 的目录。 `hdfs dfs -put localfile /test`:将本地文件 localfile 上传到 HDFS 的目录 test 中。 `hdfs dfs -get /test/hadoopfile localfile`:将 HDFS 中 test 目录下的文件 hadoopfile 下载到本地的 localfile 中。 `hdfs dfs -rm /test/hadoopfile`:删除 HDFS 中 test 目录下的文件 hadoopfile。 `hdfs dfs -mv /test/hadoopfile /test/newfile`:将 HDFS 中 test 目录下的文件 hadoopfile 移动到 test 目录下的 newfile 中。 综上所述,HDFS Shell 对于 Hadoop 分布式文件系统的管理和维护具有很重要的意义,能够方便地进行文件的上传、下载、删除、创建等操作。此外,HDFS Shell 还支持批量处理和脚本编程,可以方便地实现批量操作,提高操作效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值