HDFS运维

常用命令

查看目录下的文件列表

hdfs dfs -ls /user/yx_test

image-20220526090835623

上传文件

hdfs dfs -put bigtable /user/yx_test

image-20220525144458312

文件被复制到本地系统中

hdfs dfs -get /user/yx_test/bigtable /opt/module

image-20220525172641443

查看文件内容

hdfs dfs -cat /user/yx_test/yx_test.txt

image-20220526091052762

建立目录

hdfs dfs -mkdir -p /user/yx_test/test

image-20220526091426240

image-20220526091436991

复制文件

hdfs dfs -copyFromLocal /opt/module/bigtable /user/yx_test/test

image-20220526091558051

查看目录的健康状态

hdfs fsck /user/yx_test/test

image-20220526091714519

check 目录下的文件

hdfs fsck /user/yx_test/test -files

image-20220526091815262

查看某个目录 block 以及监控情况

hdfs fsck /user/yx_test/test -files -blocks -locations

image-20220526091857968

删除文件或目录

hdfs dfs -rm /user/yx_test/test/bigtable

image-20220526092743066

hdfs dfs -rm -r /user/yx_test/test

image-20220526092812518

查看目录损坏的块

hdfs fsck / -list-corruptfileblocks

image-20220526092902089

查看 HDFS 的基本统计信息

hdfs dfsadmin -report

image-20220526092937728

主从切换

查看 NameNode 主从状态

hdfs haadmin -getServiceState nn1

nn1 为在 hdfs-site.xml 中配置的 NameNode 服务的名称

image-20220526093032577

active 从 nn1 切换到 nn2

hdfs haadmin -failover nn1 nn2

安全模式

进入安全模式

两个 NameNode 进入安全模式

hdfs dfsadmin -safemode enter

单个 NameNode 进入安全模式

hdfs dfsadmin -fs hdfs://cpu101:8020 -safemode enter

退出安全模式

两个 NameNode 退出安全模式

hdfs dfsadmin -safemode leave

单个 NameNode 退出安全模式

hdfs dfsadmin -fs hdfs://cpu101:8020 -safemode leave

查看状态

hdfs dfsadmin -safemode get

image-20220526093106156

保存命名空间

首先进去安全模式不然报错

hdfs dfsadmin -saveNamespace

扩缩容

缩容时注意 :

进入 HDFS 监控页面,看 Number of Under-Replicated Blocks 的值,当该值 = 0 时 , 为下线完毕,才能接着下另一台

image-20220525231100925

Balancer

设置 balance 时的带宽 50M

hdfs dfsadmin -setBalancerBandwidth 52428800

image-20220526095101550

启动数据平衡 (不忙节点 ( 非 NameNode ) ) , threshold = 5% (各个节点与集群总的存储使用率相差不超过 5%( 默认 : 10%)

./sbin/start-balancer.sh -threshold 10

image-20220526095048492

停止数据平衡

./sbin/stop-balancer.sh

检查日志,了解运行情况

more /app/hadoop/hadoop-3.1.2/logs/hadoop-hdfs-balancer-node196.log

image-20220526095256464

手动降低目录副本

现象 : 当 HDFS 存储一直保持在 75% 以上,业务方面已无临时文件和垃圾文件可删 , 就对较大的表进行降副本

体积排名前三的表

hdfs fs -du /user/hive/warehouse | sort -nrk 1 | head -n 3
  1. 表的大小,默认单位 : B
  2. 表在 HDFS 中的绝对路径

当前的数据块平均副本数

hdfs fsck /user/hive/warehouse

降副本数

hdfs fs -setrep -R 2 /user/hive/warehouse/yx_test.db

降副本原理 : 给文件设置一个目标副本系数 ( 2 ),然后当前的平均副本系数 ( 3 ) 逐渐靠近目标副本系数 , 所以要反复执行 hadoop fsck 来确认

hdfs fsck /user/hive/warehouse/yx_test.db

image-20220526093623778

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值