大数据—HDFS常用命令

目录


HDFS的定义:

HDFS是一种允许文件通过网络在多台主机上分享的文件系统,可以让多台机器上的多个用户分享文件和存储空间。HDFS只是分布式文件管理系统中的一种。
HDFS的适用场景:适合一次写入,多次读出的场景,且不支持文件的修改。


开启集群

  • start-dfs.sh
  • start-all.sh 全部开启

关闭集群

  • stop-dfs.sh
  • stop-all.sh 全部关闭

Shell命令方式:

hadoop fs适用于任何不同的文件系统,比如本地文件系统和HDFS文件系统。
hdfs dfs用法相同,只能适用于HDFS文件系统。

hadoop常用命令

创建

创建目录

  • –mkdir

创建目录
hdfs dfs –mkdir /文件

递归创建

  • -mkdir -p

递归创建
hdfs dfs -mkdir -p /hdfs/fs


查看

查看目录

  • -ls

查看目录
hdfs dfs –ls /

查看文件

  • -cat

查看文件
hdfs dfs –cat /文件 (填绝对路径)

查看数据行

  • head

查看前几行数据
hdfs dfs –cat /文件 | head -5

  • tail

查看后几行数据
hdfs dfs –cat /文件 | tail -5

搜索文件

  • -find

从根目录下精确搜索文件,返回查找的文件路径
hdfs dfs -find / -name 要搜索的文件名
从指定目录下搜索名称中包含ex字符串的文件
hdfs dfs -find /指定的目录 -name “ex”

查看文件夹的大小信息

  • -du

查看文件夹的大小信息
hdfs dfs -du /文件路径
hdfs dfs -du -h /文件 (-h 文件大小转化显示)

统计目录下文件夹数量 文件数量 目录下文件总字节数。

  • -count

统计目录下文件夹数量 文件数量 目录下文件总字节数。
hdfs dfs -count /要统计的目录
结果每列含义:==目录数 文件数 总大小(字节) 目录名称


wc命令

wc命令统计指定文件中的行数、字数、字节数,并将统计结果显示输出

wc命令的用法:
hdfs dfs –cat /文件 | wc -参数

  • 命令参数:
  • 命令参数:
  • -c 统计字节数。
  • -l 统计行数
  • -m 统计字符数。
  • -w 统计字数。一个字被定义为由空白、跳格或换行字符分隔的字符串。
  • -L 打印最长行的长度
  • 查看几行数据
    hdfs dfs –cat /文件 | head -5
  • 查看几行数据
    hdfs dfs –cat /文件 | tail -5

文件操作

本地文件上传到hdfs下的test目录

  • -put

本地文件上传到hdfs下的test目录
hdfs dfs –put /文件 /test

从hdfs上把文件复制到本地 -get

  • -get

从hdfs上把文件复制到本地
hdfs dfs -get /hdfs文件 /本地文件存放路径

hdfs中移动文件和目录

  • -mv

移动文件和目录 文件到文件夹:是移动
hdfs dfs -mv /源目录 /目标目录

文件重命名

  • -mv

文件到文件:是重命名
hdfs dfs /Hello /user/Hello word

从HDFS的一个路径拷贝到HDFS的另一个路径

  • -cp

从HDFS的一个路径拷贝到HDFS的另一个路径
hdfs dfs -cp /要拷贝的文件 /目标路径

更改用户组和用户

  • -chown

要指定的用户:要制定的用户组 /要指定的文件名
hdfs dfs -chown


删除操作

删除文件

  • -rm

删除文件
hdfs dfs –rm /文件路径

删除目录

  • -rmdir

删除目录
hdfs dfs -rmdir /目录名

递归删除目录及目录里面内容

  • -rm -r -f

递归删除目录及目录里面内容
hadoop fs -rm -r -f /要删除的文件

清空hdfs的回收站

  • -expunge

清空hdfs的回收站
hdfs dfs -expunge

  • 功能概述
    Trash机制,叫做回收站或者垃圾桶,默认情况下是不开启的。
    Trash中的文件在用户可配置的时间延迟后被永久删除。也可以简单地将回收站里的文件移动到.Trash目录之外的位置来恢复回收站中的文件和目录。

HDFS文件权限

在这里插入图片描述

  • drwxr-xr-x 表示该文件的权限," - "代表其大小,root 和 supergroup 代表该文件所属用户和用户组,再后面是该文件最后修改时间和文件名信息。

  • 其中权限分为三组分别代表该用户、用户组、其它用户对该文件的权限。

关于文件的权限说明如下:

若要 rwx则 4+2+1=7
若要 rw-则 4+2=6
若要 r-x则 4+1=5
若要 r–则 = 4
若要 -wx则 2+1=3
若要 -w-则 =2
若要 - -x则 =1
若要 - - -则 =0
  1. r 表明该文件有可读权限,
  2. w代表有可写权限,
  3. x代表有可执行权限。
    如上可以使用4,2,1三个数据的组合相加来表示这些权限。
    三组rwx分别代表该用户、用户组、其它用户对该文件的权限。
  • -chmod 777
    设置用户的权限
    hdfs dfs -chmod 777 /文件

  • 28
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lyx52Hertz

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值