hadoop相关操作命令

Debug_TheWorld

于 2024-01-02 17:20:15 发布

阅读量333

点赞数 9

分类专栏：大数据学习文章标签： hadoop 大数据分布式

本文链接：https://blog.csdn.net/Debugtheworld/article/details/135345686

版权

1 篇文章 0 订阅

订阅专栏

Hadoop和HDFS都是Apache Software Foundation的开源项目，用于分布式存储和处理大数据。在命令行中，Hadoop提供了两种与文件系统相关的命令：hadoop fs和hadoop dfs。而HDFS也有其自己的命令：hdfs dfs。

hadoop fs: 这是一个通用的文件系统命令，不仅限于HDFS。它可以针对任何系统，如本地文件、HDFS文件、HFTP文件、S3文件系统等进行操作。此外，hadoop fs命令的使用范围更广泛，不仅可以用于HDFS，还可以用于其他文件系统，如Local FS。
hadoop dfs: 这是特定于HDFS的文件系统的相关操作命令。但是，它已经逐渐不被推荐使用。当使用hadoop dfs时，其内部会被转换为hdfs dfs命令。这意味着，尽管hadoop dfs是专门为HDFS设计的，但它的功能在某种程度上被hdfs dfs所覆盖。
hdfs dfs: 这是专门针对HDFS分布式文件系统的命令。与hadoop dfs类似，当使用hdfs dfs时，其内部也会被转换为相应的HDFS操作。但hdfs dfs是专为HDFS设计的命令，因此只适用于HDFS文件系统。

总结来说，hadoop fs和hdfs dfs都是与文件系统相关的命令，但它们的使用范围和功能有所不同。在实际使用中，用户应根据需求选择合适的命令。

HDFS文件系统命令

以下是一些常用的HDFS（Hadoop分布式文件系统）命令：

请注意，上述命令中的/path/to/directory和/path/to/file应替换为实际的目录或文件路径。

赋权

hdfs dfs -chgrp group path 更改文件所属组

赋权（递归更改目录的所属组）

hdfs dfs -chgrp -R /dir 递归更改dir目录的所属组

改变文件权限

hdfs dfs -chmod [-R] 权限 -path 更改文件的权限

改变文件的所有者

hdfs dfs -chown owner[-group] /dir 更改文件的所有者

递归更改目录的所属用户

hdfs dfs -chown -R owner[-group] /dir 递归更改dir目录的所属用户

创建文件以及与本地文件系统交互

hdfs dfs -touchz a.txt 创建空文件a.txt

删除文件

hdfs dfs -rm file 删除文件file

向指定路径上传文件

hdfs dfs -put file dir 向dir路径文件上传file文件

向指定目录上传文件并且改名

hdfs dfs -put filea dir/fileb 向dir上传文件filea并且把filea改名为fileb

判断文件是否存在，使用命令：hdfs fs -test -e /dir/a.txt 返回结果为正0或负1。

判断目录是否为目录，使用命令：hdfs fs -test -d /dir 返回结果为正0或负1。

判断文件是否为空，使用命令：hdfs fs -test -z /dir/a.txt 返回结果为正0或负1。

第六类：系统功能管理类：

与 hdfs dfsadmin 相关的命令：

启动和停止命令如下所示：

启动文件系统：start-all.sh
关闭文件系统：stop-all.sh
启动resourcemanager和nodemanager：start-yarn.sh
关闭resourcemanager和nodemanager：stop-yarn.sh
单独启动datanode：start-datanode.sh
启动负载均衡（尽量不要在namenode节点使用）：start-balancer.sh -t 10%（10%代表负载最高和最低相差值）
格式化文件系统：hdfs namenode -format
分发新的hdfs版本之后，以upgrade选项启动namenode：hdfs namenode -upgrade
将namenode回滚到前一版本（执行前需要停止集群并分发老的hdfs版本）：hdfs namenode -rollback
finalize会删除文件系统的前一状态，升级终结操作之后停掉namenode��分发老的hdfs版本后使用：hdfs namenode -finalize
从检查点目录装载镜像并保存到当前检查点目录（由fs.checkpoint.dir指定）：hdfs namenode importCheckpoint