Hadoop官网翻译 (HDFS命令)

本文详细介绍了HDFS的各种命令行工具,包括用户命令如fsck、getconf、groups,以及管理员命令如hdfsbalancer、dfsadmin和namenode管理。这些工具涉及HDFS的健康检查、数据平衡、加密、存储策略、快照管理和高可用性设置等关键功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

HDFS命令行

用户命令

  • dfs
  • envvars

获取hadoop环境变量

  • fsck <path>

-delete
-files -blocks -replicaDetails
-list-corruptfileblocks
-move :删除坏块到/lost+found
-openforwrite
-storagepolicies 存储策略
-replicate 满足副本策略

  • getconf

基本上都可以在配置中看到,支持 -confkey [key]

  • groups

获取groups用户

  • httpfs

httpfs和wehdfs的区别在于httpfs相当于一个网关,只需要访问该节点。webhdfs需要访问所有的节点。

  • IsSnapshottableDir

返回快照目录

  • oev

镜像相关的,edit log修复,查看等,比如
/opt/hadoop-3.3.1/bin/hdfs oev -i edits_0000000000000000013-0000000000000000013 -o tmp.edit -v -p xml
关注下 -i -o -p等参数

  • oiv

fsImage相关的参数,涉及到是否统计块信息,每次加载大小等
/opt/hadoop-3.3.1/bin/hdfs oiv -i fsimage_0000000000000000028 -o tmp.fsimage -p xml

  • snapshotDiff

对比指定目录snapshot变化

Admin命令

  • hdfs balancer

策略参数 支持datanode/blockpool datanode中应该包含blockpool,更细粒度的平衡
可以指定参与平衡的datanode,blockpool等等
通过asService可以指定作为长时服务
如果要控制移动,可以通过dfs.datanode.block-pinning.enabled指定

  • crypto

目录加密相关

  • upgrade/rollback

datanode和namenode升级判断是否可以直接升级,可以就直接改VERSION目录,如果不可以,那么可以通过BlockPoolSliceStorage类似方法进行升级。

  • dfsadmin

report 报告文件信息和统计数据,可以筛选指标。
safemode [enter|level|get|wait|forceExit] 不能修改,不提供复制/删除服务
saveNamespace 修改最新的FSImage
rollEdits 回放日志,增加一个editlog事务id记录新的改动。fsImage和editlog最后的编号就是事务id
refreshNodes 下线和上线节点
setQuota <quota> 设置配额
refreshCallQueue 刷新CallQueue
callQueue是rpc队列,用户的rpc请求是进入监听队列,然后通过调度策略分配,然后handler线程执行
在这里插入图片描述
reconfig 重新配置
fetchImage 从其他位置加载最近的fsImage
shutdownDatanodes [datanode:ipc_port]
evictWriters <datanode_host:ipc_port> 驱逐摸一个块,多用于退役写入数据慢的节点
metasave 保存元数据的主要信息

  • dfsrouter

router作用是解决NN伸缩性限制,进行子集群分割。router的意思是代理访问NN,客户端直接访问子集群的datanode。rm使用起来就是一个目录挂载多个ns目录。状态存储在ZK中

  • dfsrouteradmin

add 一个目录挂载到子ns目录上
update
rm
refreshCallQueue 重新刷新call队列

  • diskbalancer

datanode平衡

  • ec

目的是为了减少副本数,但是达到一样的效果。
-getPolicy -path
-listPolicies 查看策略
-verifyClusterSetup

  • hadmin

多个NN之间的高可用
checkHealth: hdfs haadmin -ns cdp1 -checkHealth nn3 namenode健康检查
failover
getServiceState
getAllServiceState
transitionToActive 手动切换成Active

  • mover

检查数据是否满足存储策略,不满足的话,让它满足
hdfs mover -p 目录/多个文件
hdfs mover -f 单个文件

  • namenode

主要就关注备份,升级,恢复
-baskup
-checkpoint
-upgrade
-format 慎用,初始化数据
importCheckPoint

  • storagepolicies

存储策略相关,冷热温数据策略,以及多种存储类型之间关联 归档,磁盘,ssd,ram等。

  • zkfc

formatzk 初始化zk

Debug命令

  • computeMeta
    -> 用来计算校验和,用来让坏块看起来变少。其实没好
Hadoop命令HDFS命令都是Hadoop生态系统中常用的命令,但二者有一些区别。 Hadoop命令是指一组用于管理和操作Hadoop集群的命令,包括文件操作、MapReduce作业管理、集群管理等。它们通常运行在Hadoop集群的任意一台节点上,可以通过命令行或脚本等方式进行调用。Hadoop命令主要包括: 1. Hadoop fs:用于操作Hadoop分布式文件系统(HDFS),如上传、下载、删除、复制等文件操作。 2. Hadoop jar:用于提交和管理MapReduce作业,包括作业提交、作业监控、作业杀死等。 3. Hadoop dfsadmin:用于管理HDFS集群,如节点添加、节点删除、数据块管理等。 4. Hadoop mradmin:用于管理MapReduce作业,如作业队列管理、作业优先级管理等。 HDFS命令是指一组用于操作HDFS命令,包括文件操作、目录操作、权限管理等。它们通常运行在Hadoop集群上的某个节点上,可以通过命令行或脚本等方式进行调用。HDFS命令主要包括: 1. Hdfs dfs:用于操作HDFS,包括上传、下载、删除、复制等文件操作。 2. Hdfs dfsadmin:用于管理HDFS集群,如节点添加、节点删除、数据块管理等。 3. Hdfs dfsquota:用于管理HDFS的配额,如设置用户配额、目录配额等。 4. Hdfs dfsrouteradmin:用于管理HDFS路由器,如添加路由器、删除路由器等。 总的来说,Hadoop命令更加通用,可以用于管理整个Hadoop集群,而HDFS命令更加专注于HDFS的文件操作和管理,更适合用于HDFS的管理和操作。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值