大数据-hadoop常用命令

目录

1、概述

1.1 文件系统协议

1.2 区别

2、HDFS常用命令

2.1 hdfs文件系统命令

2.1.1 文件夹路径增删改查

2.1.2 空间大小查看

2.1.3权限管理类

2.1.4文件操作(上传下载复制)

2.1.5 判断

2.1.6 系统功能管理

3、运维命令

4、 mapreduce命令

5、 hdfs系统检查工具fsck

6、运行pipies作业


1、概述

1.1 文件系统协议

  • HDFS Shell CLI支持操作多种文件系统,包括本地文件系统(file:///)、分布式文件系统(hdfs://nn:8020)等
  • 具体操作的是什么文件系统取决于命令中文件路径URL中的前缀协议
  • 如果没有指定前缀,则将会读取环境变量中的fs,defaultFS属性,以该属性值作为默认文件系统
hadoop fs -ls file:///  #操作本地文件系统
hadoop fs -ls hdfs://node 1:8020 #操作HDFS分布式文件系统
hadoop fs -ls /   #直接查询根目录,没有指定协议 将加载读取fs.defaultFS值

1.2 区别

  • hadoop dfs 只能操作HDFS文件系统(包括与Local FS间的操作),不过已经Deprecated;
  • hdfs dfs 只能操作HDFS文件系统相关(包括与Local FS间的操作),常用;
  • hadoop fs 可操作任意文件系统,不仅仅是hdfs文件系统,使用范围更广;

目前版本来看,官方最终推荐使用的是hadoop fs。当然hdfs dfs在市面上的使用也比较多

2、HDFS常用命令

2.1 hdfs文件系统命令

2.1.1 文件夹路径增删改查

hdfs dfs -mkdir dir    #创建文件夹dir
hdfs dfs -rm -r dir    #删除文件夹dir
hdfs dfs -ls path      #查看/目录下文件信息
hdfs dfs -ls -R path   #递归查看文件目录信息
hdfs dfs -stat path    #返回指定路径信息

2.1.2 空间大小查看

hdfs dfs -du -h dir     #按照适合阅读的形式人性化显示文件大小
hdfs dfs -du -s dir     #递归显示目标文件的大小
hdfs dfs -du path/file  #显示目标文件file的大小

2.1.3权限管理类

hdfs dfs -chgrp group path            #改变文件所属组
hdfs dfs -chgrp -R /dir               #递归更改dir目录的所属组
hdfs dfs -chmod [-R] 权限 -path        #改变文件的权限
hdfs dfs -chown owner[-group] /dir    #改变文件的所有者
hdfs dfs -chown -R owner[-group] /dir #递归更改dir目录的所属用户

 

2.1.4文件操作(上传下载复制)

#创建长度为0的空文件a.txt
hdfs dfs -touchz a.txt
#删除文件file
hdfs dfs -rm file
#向dir目录上传file
hdfs dfs -put file dir
#向dir目录上传文件filea并且吧filea改名为fileb
hdfs dfs -put filea dir/fileb
#下载hdfs系统下dir目录下文件file到本地path目录下
hdfs dfs -get dir/file path
#吧hdfs里面的多个文件合并成一个文件,合并后文件位于本地系统
hdfs dfs -getmerge hdfs://Master:9000/data/SogouResult.txt CombinedResult
#查看文件file
hdfs dfs -cat file
#如果文件是文本格式,相当于cat,如果文件是压缩格式,则会先解压再查看
hdfs dfs -text /dir/a.txt
#查看dir目录下a.txt文件的最后1000字节
hdfs dfs -tail /dir/a.txt
#从本地local目录下复制a文件到hdfs文件系统dir目录下
hdfs dfs -copyFromLocal /local/a.txt dir
#从hdfs文件系统hdfs目录下拷贝a文件到本地local目录下
hdfs dfs -copyToLocal /hdfs/a.txt /local/a.txt
#把hdfs文件从原路径拷贝到目标路径
hdfs dfs -copyFromLocal /dir/source /dir/target 
#吧文件从a目录移动到目录b,可用于回收站恢复文件
hdfs dfs -mv /path/a.txt /path/b.txt

 

 

2.1.5 判断

hdfs dfs -test -e /dir/a.txt  #判断文件是否存在,存在返回1,反之为0
hdfs dfs -test -d /dir        #判断dir是否为目录,存在返回1,反之为0
hdfs dfs -test -z /dir/a.txt  #判断文件是否为空,存在返回1,反之为0

2.1.6 系统功能管理

hdfs dfs -expunge 清空回收站
hdfs dfsadmin -safemode enter 进入安全模式
hdfs dfsadmin -sfaemode leave 离开安全模式
hdfs dfsadmin -decommission datanodename 关闭某个datanode节点
hdfs dfsadmin -finalizeUpgrade 终结升级操作
hdfs dfsadmin -upgradeProcess status 查看升级操作状态
hdfs version 查看hdfs版本
hdfs daemonlog -getlevel host:port 打印运行在host:port的守护进程的日志级别
hdfs daemonlog -setlevel host:port 设置运行在host:port的守护进程的日志级别
hdfs dfs -setrep -w 副本数 -R path 设置文件的副本数

3、运维命令

start-dfs.sh 启动namenode,datanode,启动文件系统
stop-dfs.sh 关闭文件系统
start-yarn.sh 启动resourcemanager,nodemanager
stop-yarn.sh 关闭resourcemanager,nodemanager
start-all.sh 启动hdfs,yarn
stop-all.sh 关闭hdfs,yarn
hdfs-daemon.sh start datanode 单独启动datanode
start-balancer.sh -t 10% 启动负载均衡,尽量不要在namenode节点使用
hdfs namenode -format 格式化文件系统
hdfs namenode -upgrade 分发新的hdfs版本之后,namenode应以upgrade选项启动
hdfs namenode -rollback 将namenode回滚到前一版本,这个选项要在停止集群,分发老的hdfs版本之后执行
hdfs namenode -finalize finalize会删除文件系统的前一状态。最近的升级会被持久化,rollback选项将再不可用,升级终结操作之后,它会停掉namenode,分发老的hdfs版本后使用
hdfs namenode importCheckpoint 从检查点目录装载镜像并保存到当前检查点目录,检查点目录由fs.checkpoint.dir指定

4、 mapreduce命令

hdfs jar file.jar 执行jar包程序
hdfs job -kill job_201005310937_0053 杀死正在执行的jar包程序
hdfs job -submit 提交作业
hdfs job -status 打印map和reduce完成百分比和所有计数器。
hdfs job -counter 打印计数器的值。
hdfs job -kill 杀死指定作业。
hdfs job -events <from-event-#> <#-of-events> 打印给定范围内jobtracker接收到的事件细节。
hdfs job -history [all]
hdfs job -history 打印作业的细节、失败及被杀死原因的细节。更多的关于一个作业的细节比如成功的任务,做过的任务尝试等信息可以通过指定[all]选项查看。
hdfs job -list [all] 显示所有作业。-list只显示将要完成的作业。
hdfs job -kill -task 杀死任务。被杀死的任务不会不利于失败尝试。
hdfs job -fail -task 使任务失败。被失败的任务会对失败尝试不利。

5、 hdfs系统检查工具fsck

hdfs fsck -move 移动受损文件到/lost+found
hdfs fsck -delete 删除受损文件。
hdfs fsck -openforwrite 打印出写打开的文件。
hdfs fsck -files 打印出正被检查的文件。
hdfs fsck -blocks 打印出块信息报告。
hdfs fsck -locations 打印出每个块的位置信息。
hdfs fsck -racks 打印出data-node的网络拓扑结构

6、运行pipies作业

hdfs pipes -conf 作业的配置
hdfs pipes -jobconf <key=value>, <key=value>, … 增加/覆盖作业的配置项
hdfs pipes -input 输入目录
hdfs pipes -output 输出目录
hdfs pipes -jar Jar文件名
hdfs pipes -inputformat InputFormat类
hdfs pipes -map Java Map类
hdfs pipes -partitioner Java Partitioner
hdfs pipes -reduce Java Reduce类
hdfs pipes -writer Java RecordWriter
hdfs pipes -program 可执行程序的URI
hdfs pipes -reduces reduce个数

  • 3
    点赞
  • 41
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
'[IT18掌www.it18zhang.com]001.Hadoop基础篇.pptx' '[IT18掌www.it18zhang.com]014.Hadoop Win7开启网络访问.pptx' '[IT18掌www.it18zhang.com]Kafka.pptx' '[IT18掌www.it18zhang.com]002.VMware下载与安装.pptx' '[IT18掌www.it18zhang.com]015.Hadoop 架构分析.pptx' '[IT18掌www.it18zhang.com]KVM.pptx' '[IT18掌www.it18zhang.com]003.Ubuntu下载与虚拟机下安装.pptx' '[IT18掌www.it18zhang.com]016.Hadoop 架构分析之启动脚本分析.pptx' '[IT18掌www.it18zhang.com]Scala.pptx' '[IT18掌www.it18zhang.com]004.Ubuntu常用命令.pptx' '[IT18掌www.it18zhang.com]017.Hadoop 架构分析之启动脚本总结.pptx' '[IT18掌www.it18zhang.com]Spark Graph编程指南.pptx' '[IT18掌www.it18zhang.com]005.Ubuntu目录与权限.pptx' '[IT18掌www.it18zhang.com]018.Hadoop MapReduce初识.pptx' '[IT18掌www.it18zhang.com]Spark SQL DataFrame Dataset编程指南.pptx' '[IT18掌www.it18zhang.com]006.Ubuntu软件包桌面与增强工具.pptx' '[IT18掌www.it18zhang.com]019.Hadoop MapReduce原理.pptx' '[IT18掌www.it18zhang.com]Spark Streaming编程指南.pptx' '[IT18掌www.it18zhang.com]007.Ubuntu本地软件源与iso制作.pptx' '[IT18掌www.it18zhang.com]019.Hadoop YARN事件分发原理.pptx' '[IT18掌www.it18zhang.com]Spark编程指南.pptx' '[IT18掌www.it18zhang.com]008.Ubuntu虚拟机克隆与Mac地址生成与网络连接方式.pptx' '[IT18掌www.it18zhang.com]020.Hadoop HDFS.pptx' '[IT18掌www.it18zhang.com]Spark编译运行处理.pptx' '[IT18掌www.it18zhang.com]009.Hadoop-Ubuntu下JDK与Hadoop安装配置.pptx' '[IT18掌www.it18zhang.com]021.Hadoop HDFS CLI.pptx' '[IT18掌www.it18zhang.com]Spark基础.pptx' '[IT18掌www.it18zhang.com]010.Hadoop配置-独立与伪分布式模式.pptx' '[IT18掌www.it18zhang.com]Ambari Hadoop集群管理工具.pptx' '[IT18掌www.it18zhang.com]Spark调优.pptx' '[IT18掌www.it18zhang.com]011.Hadoop配置-完全分布式模式.pptx' '[IT18掌www.it18zhang.com]Avro.pptx' '[IT18掌www.it18zhang.com]ZooKeeper.pptx' '[IT18掌www.it18zhang.com]012.Hadoop Windows下免Cygwin伪分布安装

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值