CDH Disk Balancer 磁盘数据均衡

前提:
CDH5.10

由于数据量过多,磁盘大小太小,导致磁盘使用率高达90%以上,于是新增磁盘,可问题来了,如何将这两块磁盘上的数据进行均衡呢?
hadoop在2.X中已经有相应的方法了(具体哪个版本忘了),本次基于CDH来做

1.设置dfs.disk.balancer.enabled 为true
这里写图片描述

2.hdfs diskbalancer -plan cdh03(需要均衡的机器) 会生成一个*.plan.json的文件

3.hdfs diskbalancer -execute /system/diskbalancer/2017-Jun-26-10-10-14/cdh04.plan.json

4.hdfs diskbalancer -query cdh04
DONE的时候表示已经执行完毕

备注:
此过程由于数据量相对比较大,磁盘IO、网络IO占用都会比较高,虽然有参数可以配置,如dfs.datanode.balance.bandwidthPerSec,但仍然建议在集群负载不高时进行,特别是生产集群。另外执行时间的长度取决于:数据量、网络IO、磁盘IO及新写入的数据量大小
可同时配置dfs.datanode.fsdataset.volume.choosing.policy(磁盘的选择策略)

参考地址:

http://blog.cloudera.com/

CDH磁盘挂载及磁盘扩容可以通过以下步骤完成: 1. 确认硬盘已经添加到服务器上,并且硬件已经被识别。可以使用命令 `fdisk -l` 查看服务器上的硬盘信息。 2. 对于新添加的硬盘,需要进行分区和格式化。可以使用命令 `fdisk /dev/sdX`(X为新添加的硬盘标识,如sdb、sdc等)进入分区工具,按照提示进行分区操作。完成分区后,使用命令 `mkfs.ext4 /dev/sdX1`(X为新添加的硬盘标识,1为第一个分区)格式化分区。 3. 创建一个目录作为挂载点,例如 `/data`,可以使用命令 `mkdir /data` 创建。 4. 使用命令 `mount /dev/sdX1 /data` 将新添加的硬盘挂载到 `/data` 目录下。如果需要在系统启动时自动挂载,可以在 `/etc/fstab` 文件中添加一行 `/dev/sdX1 /data ext4 defaults 0 0`。 5. 确认挂载成功,可以使用命令 `df -h` 查看挂载点 `/data` 的文件系统。 如果需要扩容已挂载的磁盘,可以按照以下步骤进行: 1. 确认硬盘已经添加到服务器上,并且硬件已经被识别。 2. 使用命令 `parted /dev/sdX`(X为已挂载的硬盘标识,如sdb、sdc等)进入分区工具。 3. 输入 `resizepart 1` 命令来调整已挂载磁盘的分区大小。 4. 输入 `quit` 退出分区工具。 5. 使用命令 `resize2fs /dev/sdX1`(X为已挂载的硬盘标识,1为第一个分区)来调整文件系统大小。 完成上述步骤后,已挂载磁盘的容量就会扩大。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

shengjk1

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值