Hadoop管理命令

本文介绍了Hadoop管理命令,包括dfsadmin、文件系统验证(fsck)的详细使用,如检查over-replicated、under-replicated和corrupt blocks等状态,并提供了如何找到文件所有块的方法。还提及了DataNode块扫描的周期和查看方式,以及Balancer工具的启动和停止,以及相关参数设置。
摘要由CSDN通过智能技术生成

1. hadoop dfsadmin


2. 文件系统验证(fsck)

hadoop fsck /

输出说明

2.1 over-replicated block: 说明一些文件数超出所属文件的限定

2.2 under-replicated block:文件块数未达到要求的副本数

2.3 misreplicated block :不满足块副本存储位置策略的块

2.4 corrupt blocks:所有块副本全部出现问题

2.5 missing replicas:集群中不存在副本的文件块

选项

-move : 将出现问题的文件放到HDFS的lost+found中

-delete:将出现问题的文件删除,删除后不可恢复


3. 找到一个文件的所有块

hadoop fsck /user/admin/hello.txt -files -blocks -racks

-files:显示文件名、大小、块数、是否可用

-blocks:显示每个块在文件中的信息,一个块一行

-racks:显示每个块所在机架位置以及datanode位置


4. DataNode块扫描

在dfs.DataNode.scan.period.hours属性设定default:504小时,即3周,出现问题的块会被报告给namenode

可以通过http://datanodeip:50075/blockScannerReport查看报告样本

http://datanodeip:50075/blockScannerReport?listblocks,可

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值