(三)HDFS常用指令

HDFS常用指令:

hadoop fs -mkdir /park在hdfs 的根目录下,创建 park目录
hadoop fs -ls /查看hdfs根目录下有哪些目录
hadoop fs -lsr /递归查看某个目录下的所有文件
hadoop fs -put /root/1.txt /park将linux操作系统root目录下的1.txt放在hdfs的park目录下
hadoop fs -get /park/jdk /home把hdfs文件系统下park目录的文件下载到linux的home目录下
hadoop fs -rm /park/文件名 删除hdfs 的park目录的指定文件
hadoop fs -rmdir /park删除park目录,但是前提目录里没有文件
hadoop fs -rmr /park删除park目录,即使目录里有文件
hadoop fs -cat /park/a.txt查看park目录下的a.txt文件内容
hadoop fs -tail /park/a.txt查看park目录下a.txt文件末尾的数据
hadoop fs –mv /park02  /park01将HDFS上的park02目录重命名为park01
hadoop fs -mv /park02/1.txt  /park01将park02目录下的1.txt文件移动到/park01目录下
hadoop fs -touchz /park/2.txt 创建一个空文件
hadoop fs -getmerge /park  /root/tmp将park目录下的所有文件内容合并成一个文件,并下载到/root/tmp目录。
hadoop jar abc.jar执行指定jar包
hadoop fsck /park/test.txt  -files -blocks -locations -racks查看test.txt文件的block信息以及机架信息
  • hadoop2.0默认的切块大小是128M,若上传的文件大于128M,则会切成多块存储
  • 切块是以文件为单位的,不同的文件,不能共用一个文件块。此外,文件块多大,在磁盘就占多大。
  • HDFS不适合存储海量的小文件,因为会占用namenode节点大量的内存空间。因为每一条元数据大约占用150字节。
  • HDFS对于已上传的文件,是不允许修改的,但允许数据追加

hadoop dfsadmin -rollEdits手动合并操作记录和镜像文件
  • 源数据会根据配置文件 core-site.xml里的hadoop.tmp.dir属性的路径来存储。
  • Edits文件的作用:记录每个HDFS的操作。
  • Fsimage文件的作用:元数据(namenode)的镜像文件
hadoop namenode -format格式化
  • 此指令的本质作用是生成新的 Fsimage文件 和 Edits 文件。
  • 这个指令很危险,因为会清掉原来的信息。可以通过配置文件,让hadoop namenode -format 失效
  • 初次使用hadoop,需要先格式化
hadoop dfsadmin -safemode enter手动进入安全模式

hadoop dfsadmin -safemode leave

手动退出安全模式
  • 安全模式的特点:HDFS只能对外提供读服务,不能提供写服务。
  • 每次HDFS启动时,每台datanode都会namenode汇报自身文件块的存储情况。namenode收到这些信息后,会检测和统计文件块的数量是否满足要求,以及副本数量,以及文件数据是否损坏。如果检测有问题,会进行修复,在修复的过程中,HDFS会进入安全模式。
  • 如果是伪分布式模式,副本数量要设置1。如果>1,会导致副本数量一直不能达到要求,会一直处于安全模式
hadoop fs - mv /user/root/.Trash/Current/park/test.txt  /park把test.txt 从回收站还原
  • 删除了文件后,可以使用递归查询去回收站查找:hadoop fs -lsr /user/root/.Trash
  • 找到文件路径后使用mv指令恢复即可
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值