Hadoop HDFS详解和常用指令

最新推荐文章于 2024-08-13 17:25:44 发布

Arno_Yu

最新推荐文章于 2024-08-13 17:25:44 发布

阅读量786

点赞数

分类专栏： Hadoop 文章标签： Hadoop hdfs 常用指令

本文链接：https://blog.csdn.net/yu342107056/article/details/88425670

版权

本文深入探讨Hadoop的分布式文件系统HDFS，包括其基本结构、Block概念、NameNode与DataNode的角色，以及读写流程。HDFS通过切块存储大文件并实施多复本策略确保数据可靠性。NameNode管理元数据，DataNode存储数据，并通过心跳机制保持通信。文章还讨论了SecondaryNameNode的作用、多复本放置策略和机架感知策略。

摘要由CSDN通过智能技术生成

HDFS：

是Hadoop中用于数据的分布式存储的组件
根据Google论文《The Google File System》来设计的

常用指令

指令	说明
hadoop fs -put	向HDFS上传文件
hadoop fs -mkdir	在HDFS上创建了目录（实际上只是一个路径标记）
hadoop fs -get	下载
hadoop fs -rm	删除文件
hadoop fs -rmdir	删除目录
hadoop fs -rmr	递归删除
hadoop fs -ls	查看指定路径下的子文件和子目录
hadoop fs -lsr	递归查看
hadoop fs -cat	查看指定文件中的内容
hadoop fs -tail	查看指定文件的最后1000个字节的内容
hadoop fs -mv	剪切文件
hadoop fs -cp	复制文件
hadoop fs -touchz	创建一个空文件
hadoop fsck /test/txt/a.txt -files -blocks -locations -racks