HDFS常用操作命令 DFS

最新推荐文章于 2024-08-13 17:25:44 发布

weixin_42411588

最新推荐文章于 2024-08-13 17:25:44 发布

阅读量8.4k

点赞数 3

分类专栏：大数据文章标签： hdfs 深度优先 hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42411588/article/details/123351995

版权

大数据专栏收录该内容

3 篇文章 1 订阅

订阅专栏

查看帮助

hdfs dfs –help

查看文件常用命令

命令格式
1.hdfs dfs -ls path 查看文件列表
2.hdfs dfs -lsr path 递归查看文件列表
3.hdfs dfs -du path 查看path下的磁盘情况，单位字节
使用示例
1.hdfs dfs -ls / 查看当前目录
2.hdfs dfs - lsr / 递归查看当前目录

创建文件夹

命令格式
hdfs dfs -mkdir path
使用用例
hdfs dfs -mkdir /user/iron
注：该命令可递归创建文件夹，不可重复创建，在Linux文件系统中不可见

创建文件

命令格式
hdfs dfs -touchz path
使用用例
hdfs dfs -touchz /user/iron/iron.txt
注：该命令不可递归创建文件即当该文件的上级目录不存在时无法创建该文件，可重复创建但会覆盖原有的内容

复制文件和目录

命令格式
hdfs dfs -cp 源目录目标目录
使用用例
hdfs dfs -cp /user/iron /user/iron01
注：该命令会将源目录的整个目录结构都复制到目标目录中
hdfs dfs -cp /user/iron/* /user/iron01
注：该命令只会将源目录中的文件及其文件夹都复制到目标目录中

移动文件和目录

命令格式
hdfs dfs -mv 源目录目标目录
使用用例
hdfs dfs -mv /user/iron /user/iron01

赋予权限

命令格式
hdfs dfs -chmod [权限参数][拥有者][:[组]] path
使用用例
hdfs dfs -chmod 777 /user/*
注：该命令是将user目录下的所用文件及其文件夹（不包含子文件夹中的文件）赋予最高权限：读，写，执行
777表示该用户，该用户的同组用户，其他用户都具有最高权限

上传文件

命令格式
hdfs dfs -put 源文件夹目标文件夹
使用用例
hdfs dfs -put /home/hadoop01/iron /user/iron01
注：该命令上传Linux文件系统中iron整个文件夹
hdfs dfs -put /home/hadoop01/iron/* /user/iron01
注：该命令上传Linux文件系统中iron文件夹中的所有文件（不包括文件夹）
类似命令：
hdfs dfs -copyFromLocal 源文件夹目标文件夹作用同put
hdfs dfs -moveFromLocal 源文件夹目标文件夹上传后删除本地

下载文件

命令格式
hdfs dfs -get源文件夹目标文件夹
使用用例
hdfs dfs -get /user/iron01 /home/hadoop01/iron
注：该命令下载hdfs文件系统中的iron01整个文件夹到Linux文件系统中
hdfs dfs -get /user/iron01/* /home/hadoop01/iron
注：该命令下载hdfs文件系统中的iron01整个文件夹到Linux文件系统中（不包含文件夹）
类似命令
hdfs dfs -copyToLocal 源文件夹目标文件夹作用同get
hdfs dfs -moveToLocal 源文件夹目标文件夹 get后删除源文件

查看文件夹中有多少个文件

hdfs dfs -count /路径

查看hdfs的总空间

hdfs dfs -df /路径
hdfs dfs -df -h /路径

查看文件内容

命令格式
hadoop fs -cat path 从头查看这个文件
hadoop fs -tail path 从尾部查看最后1K
使用用例
hadoop fs -cat /userjzl/home/book/1.txt
hadoop fs -tail /userjzl/home/book/1.txt

删除文件

命令格式
hdfs dfs -rm 目标文件
hdfs dfs -rm -r 目标文件递归删除（慎用）
使用用例
hdfs dfs -rm /user/test.txt 删除test.txt文件
hdfs dfs -rm -r /user/testdir 递归删除testdir文件夹
注：rm不可以删除文件夹

查询分区错误文件

命令格式

hdfs fsck 目标路径 -openforwrite

修复错误分区

命令格式

hdfs debug recoverLease -path 错误文件

递归列出hdfs上某个路径下文件夹、文件数

命令格式

hadoop fs -ls 查询路径 | grep "^d" | awk '{print $NF}' |xargs hadoop fs -count | sort -n -r -k 2

注: sort的使用

语法：

sort [选项] ... [文件] ...

选项：

-b：忽略前面空格。

-c：测试文件是否已经排序。

-d：根据字典顺序排序，仅比较数字字母空格等字符。

-f：忽略大小写。

-i：仅比较可打印字符。

-n：纯数字排列

-R：根据哈希值随机排序。

-r：反向，颠倒顺序。

-k：定义排序关键字。原来的：第几个区间，与t相辅。

-t：分隔符

-m：仅仅合并已经排序好的文件，不执行排序操作。

-s：稳定的排序算法。

-o：排序结果写入文件，而不是标准输出到设备。

-u：相同的行只留一行

-M：月份

weixin_42411588

关注

3
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。