【大数据清洗和预处理】1.8HDFS的shell操作(2)(学习笔记)

本文详细介绍了HDFS的shell操作,包括创建目录、移动重命名文件、文件合并下载、检查文件信息、创建时间戳文件、复制文件和目录、查看文件大小、上传下载文件以及定时采集数据到HDFS的脚本实践。内容涵盖HDFS的基本操作及实用技巧。
摘要由CSDN通过智能技术生成

创建/ied02目录,将ied01/test.txt移动到/ied02目录,并且改名为exam.txt


在Hadoop WebUI界面查看 

9、文件合并下载
创建sport.txt、music.txt和book.txt并上传


在Hadoop WebUI界面查看上传的三个文件,注意文件名是按字典排序了的

 


合并/ied01目录的文件下载到本地当前目录的merger.txt,执行命令:hdfs dfs -getmerge /ied01/* merger.txt


下面,查看本地的merger.txt,看是不是三个文件合并后的内容

 


由此可见,merger.txt是book.txt、music.txt与sport.txt合并后的结果

10、检查文件信息
fsck: file system check —— 文件系统检查

检查/ied01/book.txt文件,执行命令:hdfs fsck /ied01/book.txt -files -blocks -locations -racks


我们知道HDFS里一个文件块是128MB,上传一个大于128MB的文件,hadoop-3.3.4.tar.gz大约663.24MB 

128 M B × 5 = 640 M B < 663.24 M B < 768 M B = 128 M B × 6 128 MB\times 5 = 640MB \lt 663.24MB \lt 768MB = 128 MB\times 6128MB×5=640MB<663.24MB<768MB=128MB×6 ,HDFS会将hadoop-3.3.4.tar.gz分割成6块。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值