如何平衡HDFS中的DataNode存储?

As nodes are added and deleted in a Hadoop cluster. Storage usage across DataNodes may be different. Some DataNodes’ disks are almost used up while some others’ are almost empty.

Hadoop群集中添加和删除节点时。 跨DataNode的存储使用情况可能有所不同。 一些DataNode的磁盘几乎用完,而另一些磁盘几乎是空的。

How to balance data across DataNodes in HDFS?

如何在HDFS中的各个DataNode之间平衡数据?

Hadoop provides the balancer to redistribute the data.

Hadoop提供了用于重新分配数据的平衡器。

Brief introduction to balancer in Hadoop: balancer.

Hadoop中的balancer简介: balancer

The design and discussion of balancer in Hadoop: HADOOP-1652.

Hadoop中的均衡器设计和讨论: HADOOP-1652

The command to start balancer: hadoop balancer as the administrator.

启动 balancer的命令: hadoop balancer以管理员身份。

Answered by Eric Z Ma.
埃里克·马(Eric Z Ma)回答。

翻译自: https://www.systutorials.com/how-to-balance-datanode-storage-in-hdfs/

HDFSHadoop Distributed File System)是Hadoop生态系统的一种分布式文件系统,它的设计目标是能够在廉价的硬件上存储大量数据,并且保证高可靠性和高性能。 HDFS将大文件划分为若干个数据块(默认大小为64M),并将这些数据块分散存储在不同的节点上,这些节点可以是集群的任何一台机器。每个数据块会有多个备份(默认为3份),这些备份会存储在不同的节点上,以保证数据的可靠性。HDFS会通过数据块的复制策略,将数据块尽可能地分散存储在不同的机器上,以保证数据的可靠性和高效性。当某个节点失效时,HDFS会自动将该节点上的数据块复制到其他节点上,保证数据的可靠性。 在HDFS,数据的存储是通过NameNodeDataNode来实现的。NameNode是整个HDFS的管理节点,它负责管理文件系统的命名空间、文件元数据信息、数据块的分布情况等。DataNode存储数据块的节点,它负责存储数据块、向NameNode汇报数据块的存储信息等。 在HDFS,当一个客户端需要存储一个文件时,它会将文件切分成若干个数据块,并将这些数据块分散存储在不同的DataNode上。同时,客户端会向NameNode发送一个请求,将文件的元数据信息存储在NameNode上。当客户端需要读取文件时,它会向NameNode发送一个请求,获取文件的元数据信息,然后通过DataNode获取数据块,并将这些数据块组成完整的文件返回给客户端。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值