hadoop命令大全(表格版)

10 篇文章 1 订阅

1 hdfs文件系统命令

1.1 文件路径增删改查系列:

命令功能
hdfs dfs -mkdir dir创建文件夹
hdfs dfs -rmr dir删除文件夹dir
hdfs dfs -ls查看目录文件信息
hdfs dfs -lsr递归查看文件目录信息
hdfs dfs -stat path返回指定路径的信息

1.2 空间大小查看系列命令:

命令功能
hdfs dfs -du -h dir按照适合阅读的形式人性化显示文件大小
hdfs dfs -dus uri递归显示目标文件的大小
hdfs dfs -du path/file显示目标文件file的大小

1.3 权限管理类:

命令功能
hdfs dfs -chgrp group path改变文件所属组
hdfs dfs -chgrp -R /dir递归更改dir目录的所属组
hdfs dfs -chmod [-R] 权限 -path改变文件的权限
hdfs dfs -chown owner[-group] /dir改变文件的所有者
hdfs dfs -chown -R owner[-group] /dir递归更改dir目录的所属用户

1.4 文件操作(上传下载复制)系列:

命令功能
hdfs dfs -touchz a.txt创建长度为0的空文件a.txt
hdfs dfs -rm file删除文件file
hdfs dfs -put file dir向dir文件上传file文件
hdfs dfs -put filea dir/fileb向dir上传文件filea并且把filea改名为fileb
hdfs dfs -get file dir下载file到本地文件夹
hdfs dfs -getmerge hdfs://Master:9000/data/SogouResult.txt CombinedResult把hdfs里面的多个文件合并成一个文件,合并后文件位于本地系统
hdfs dfs -cat file查看文件file
hdfs fs -text /dir/a.txt如果文件是文本格式,相当于cat,
如果文件是压缩格式,则会先解压,再查看
hdfs fs -tail /dir/a.txt查看dir目录下面a.txt文件的最后1000字节
hdfs dfs -copyFromLocal localsrc path从本地复制文件
hdfs dfs -copyToLocal /hdfs/a.txt /local/a.txt从hdfs拷贝到本地
hdfs dfs -copyFromLocal /dir/source /dir/target把文件从原路径拷贝到目标路径
hdfs dfs -mv /path/a.txt /path/b.txt把文件从a目录移动到b目录,
可用于回收站恢复文件

1.5 判断系列:

命令功能
hdfs fs -test -e /dir/a.txt判断文件是否存在,正0负1
hdfs fs -test -d /dir判断dir是否为目录,正0负1
hdfs fs -test -z /dir/a.txt判断文件是否为空,正0负1

1.6 系统功能管理类:

命令功能
hdfs dfs -expunge清空回收站
hdfs dfsadmin -safemode enter进入安全模式
hdfs dfsadmin -sfaemode leave离开安全模式
hdfs dfsadmin -decommission datanodename关闭某个datanode节点
hdfs dfsadmin -finalizeUpgrade终结升级操作
hdfs dfsadmin -upgradeProcess status查看升级操作状态
hdfs version查看hdfs版本
hdfs daemonlog -getlevel host:port打印运行在host:port的守护进程的日志级别
hdfs daemonlog -setlevel host:port设置运行在host:port的守护进程的日志级别
hdfs dfs -setrep -w 副本数 -R path设置文件的副本数

2 运维命令

命令功能
start-dfs.sh启动namenode,datanode,启动文件系统
stop-dfs.sh关闭文件系统
start-yarn.sh启动resourcemanager,nodemanager
stop-yarn.sh关闭resourcemanager,nodemanager
start-all.sh启动hdfs,yarn
stop-all.sh关闭hdfs,yarn
hdfs-daemon.sh start datanode单独启动datanode
start-balancer.sh -t 10%启动负载均衡,尽量不要在namenode节点使用
hdfs namenode -format格式化文件系统
hdfs namenode -upgrade分发新的hdfs版本之后,namenode应以upgrade选项启动
hdfs namenode -rollback将namenode回滚到前一版本,这个选项要在停止集群,分发老的hdfs版本之后执行
hdfs namenode -finalizefinalize会删除文件系统的前一状态。最近的升级会被持久化,
rollback选项将再不可用,升级终结操作之后,
它会停掉namenode,分发老的hdfs版本后使用
hdfs namenode importCheckpoint从检查点目录装载镜像并保存到当前检查点目录,检查点目录由fs.checkpoint.dir指定

3 mapreduce命令

命令功能
hdfs jar file.jar执行jar包程序
hdfs job -kill job_201005310937_0053杀死正在执行的jar包程序
hdfs job -submit提交作业
hdfs job -status打印map和reduce完成百分比和所有计数器。
hdfs job -counter打印计数器的值。
hdfs job -kill杀死指定作业。
hdfs job -events <from-event-#> <#-of-events>打印给定范围内jobtracker接收到的事件细节。
hdfs job -history打印作业的细节、失败及被杀死原因的细节。
更多的关于一个作业的细节比如成功的任务,
做过的任务尝试等信息可以通过指定[all]选项查看
hdfs job -list [all]显示所有作业。-list只显示将要完成的作业。
hdfs job -kill -task杀死任务。被杀死的任务不会不利于失败尝试。
hdfs job -fail -task使任务失败。被失败的任务会对失败尝试不利。

4 hdfs系统检查工具fsck

命令功能
hdfs fsck -move移动受损文件到/lost+found
hdfs fsck -delete删除受损文件。
hdfs fsck -openforwrite打印出写打开的文件。
hdfs fsck -files打印出正被检查的文件。
hdfs fsck -blocks打印出块信息报告。
hdfs fsck -locations打印出每个块的位置信息。
hdfs fsck -racks打印出data-node的网络拓扑结构。

5 运行pipies作业

hdfs pipes -conf 作业的配置

hdfs pipes -jobconf <key=value>, <key=value>, … 增加/覆盖作业的配置项

hdfs pipes -input 输入目录

hdfs pipes -output 输出目录

hdfs pipes -jar Jar文件名

hdfs pipes -inputformat InputFormat类

hdfs pipes -map Java Map类

hdfs pipes -partitioner Java Partitioner

hdfs pipes -reduce Java Reduce类

hdfs pipes -writer Java RecordWriter

hdfs pipes -program 可执行程序的URI

hdfs pipes -reduces reduce个数

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值