Hadoop常用命令

Hadoop常用命令

命令基本格式

hadoop fs -cmd <args>
  1. ls

    hadoop fs -ls /
    hadoop fs -ls -R /

    ls

  2. put

    hadoop fs -put <local file> <hdfs file>
    hadoop fs -put dongle.c /
    hadoop fs -ls /

put

  1. moveFormLocal

    hadoop fs -moveFromLocal <local src> ... <hdfs dst>  # 与put相似,但是源文件从src消失
    hadoop fs -copyFromLocal <local src> ... <hdfs dst>  # 与put相似,可以从键盘读取输入到hdfs

    FromLocal

  2. get

    hadoop fs -get <hdfs file> <local file or dir>

    get

  3. copyToLocal

    hadoop fs -copyToLocal <hdfs src> <local src> # 与get类似

  4. rm

    hadoop fs -rm <hdfs file>
    hadoop fs -rm -r <hdfs dir>

    rm

  5. mkdir

    hadoop fs -mkdir <hdfs path>
    hadoop fs -mkdir -p <hdfs path>

    mkdir

  6. getmerge

    将hdfs指定目录下所有的文件排序后合并到local指定的文件中,文件不存在时会自动创建,文件存在时会覆盖里面的内容。

    hadoop fs -getmerge <hdfs dir> <local file>
    hadoop fs -getmerge -nl <hdfs dir> <local file>

    加上nl选项后,合并到local file中的hdfs文件之间会空出一行。

    getmerge

  7. cp

    hadoop fs -cp <hdfs file> <hdfs file>

    cp

  8. mv

    hadoop fs -mv <hdfs file> <hdfs file>

  9. count

    统计hdfs对应路径下的目录个数,文件个数,文件总计大小

    hadoop -count <hdfs path>

    count

  10. du

    显示hdfs对应路径下每个文件夹和文件的大小

    hadoop fs -du <hdfs path>
    hadoop fs -du -s <hdfs path>
    hadoop fs -du -h <hdfs path>

    du

  11. text

    将文本文件或某些格式的非文本文件通过文本格式输出

    hadoop fs -text <hdfs file>

  12. setrep

    改变一个文件在hdfs中的副本个数

    hadoop fs -setrep -R 3 <hdfs path>

  13. stat

    hadoop fs -stat [format] <hdfs path>

    返回对应路径的状态信息

    [format]可选参数有:%b(文件大小), %o(Block大小),%n(文件名),%r(副本个数),%y(最后一次修改日期和时间)

    stat

  14. tail

    hadoop fs -tail <hdfs file>

  15. archive

    hadoop archive -archiveName name.har -p <hdfs parent dir> <src file> <hdfs dst dir>
    
    hadoop archive -archiveName hadoop.har -p /user 1.txt 2.txt /des

    解释:name.har是压缩包名,hdfs parent dir是需要压缩的文件所在的父目录,src file 是需要压缩文件的列表,hdfs dst dir 是压缩后的压缩包的位置。

    archive

    archive

  16. balancer

    hdfs balancer

    如果管理员发现某些DataNode保存数据过多,某些DataNode保存数据较少,可以使用上述命令手动启动内部的均衡过程

  17. dfsadmin

    hdfs dfsadmin -help

    管理员可以通过dfsadmin管理HDFS

    hdfs dfsadmin -safemode <enter| leave | get | wait>

    enter:进入安全模式

    leave:离开安全模式

    get:获知是否开启安全模式

    wait:等待离开安全模式

  18. distcp

    用在两个hdfs之间拷贝数据

参考链接:https://segmentfault.com/a/1190000002672666

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值