Hadoop学习12-2：DataNode管理

最新推荐文章于 2023-08-03 17:07:33 发布

愿你被这个世界温暖相待

最新推荐文章于 2023-08-03 17:07:33 发布

阅读量388

点赞数

分类专栏： # Hadoop基础文章标签： hadoop hdfs big data

本文链接：https://blog.csdn.net/qq_43967413/article/details/121843730

版权

Hadoop基础专栏收录该内容

16 篇文章 4 订阅

订阅专栏

1 服役新节点

随着公司业务的增长，数据量越来越大，原有的数据节点的容量已经不能满足存储数据的需求，需要在原有集群基础上动态添加新的数据节点

场景准备

在hadoop104主机上再克隆一台hadoop105主机（这里自行选主机即可），使用VM的话：右键虚拟机>管理>克隆>创建完整克隆
修改IP地址（/etc/sysconfig/network-scripts/ifcfg-ens33（网卡标号可以通过ifconfig查看））和主机名称（/etc/hostname）：Hadoop学习1：hadoop模板机准备：非桌面版Centos7下载安装配置以及问题总结
删除原来HDFS文件系统留存的文件（/opt/module/hadoop-3.1.3/data和 log)

如果不删除这些目录，可能NameNode会认为你跟原来的机器是同一个机器，在NameNode中不会单独管理该克隆节点

source 一下配置文件使文件生效或者重启source /etc/profile

2 退役旧节点

2.1 黑名单和白名单

添加到白名单的主机节点，都允许访问NameNode，不在白名单的主机节点，都会被直接退出
添加到黑名单的主机节点，不允许访问NameNode，会在数据迁移后退出

实际情况下，白名单用于确定允许访问NameNode的 DataNode节点，内容配置一般与workers文件（hadoop2.x中为slaves文件）内容一致。黑名单用于在集群运行过程中退役DataNode节点

2.2 配置白名单和黑名单

在NameNode的/opt/module/hadoop-3.1.3/etc/hadoop目录下分别创建whitelist和blacklist文件（具体的根据安装的目录路径,找到该安装目录下的etc/hadoop）

touch blacklist
touch whitelist

在NameNode的hdfs-site.xml配置文件中增加dfs. hosts和 dfs.hosts.exclude配置

<property>
  <name>dfs.hosts</name>
  <value>/opt/module/hadoop-3.1.3/etc/hadoop/whitelist</value>
</property>

<property>
  <name>dfs.hosts.exclude</name>
  <value>/opt/module/hadoop-3.1.3/etc/hadoop/blacklist</value>
</property>

配置好后进行文件分发

#同步hadoop文件夹即可
xsync hadoop

重启集群

2.3 黑名单退役

这里直接添加主机名或者ip
刷新NameNode：hdfs dfsadmin -refreshNodes

黑名单退役服务器并刷新后，通过管理页面可以看到是如下的状态表示退役中。有这个状态是因为，一个DataNode在集群中存在过，那么说明有可能存在一些有用的数据，这个状态就是用来交接这些数据的，将他的一些数据转移到其他可用的DataNode上

当状态变为退役完成后，就会变成橙色

2.4 白名单退役

过程同黑名单退役，这里不再赘述，不同的是不允许访问的不写在whitelist文件即可

白名单退役方式是直接抛弃节点，没有数据的交接过程，可能造成数据的丢失通过管理页面，并没有上述的一个禁止的状态，而是在管理页面上是不显示对应的节点，也就是直接抛弃了，所以该方式不推荐

黑名单和白名单同时设置同一个主机，黑名单优先级更高

3 DataNode多目录存储

在hdfs-site.xml文件中在原本的存储目录配置中添加多个目录，并以,分割
上述配置好后需要进行分发配置文件以及格式化集群，所以这个操作最好是在一开始就应该规划好，相关配置分发和格式化可参考这里Hadoop学习4：集群配置与测试下的集群单点启动
上传数据到DataNode的时候，即使创建了多个数据的存储目录，但是上传的信息是并不会在每一个存储的目录出现的，而是随机选择一个

多目录的一个意义是可以挂载不同的磁盘上进行扩展

愿你被这个世界温暖相待

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop学习12-2：DataNode管理

1 服役新节点场景准备2 退役旧节点2.1 黑名单和白名单2.2 配置白名单和黑名单2.3 黑名单退役2.4 白名单退役3 DataNode多目录存储1 服役新节点随着公司业务的增长，数据量越来越大，原有的数据节点的容量已经不能满足存储数据的需求，需要在原有集群基础上动态添加新的数据节点场景准备在hadoop104主机上再克隆一台hadoop105主机（这里自行选主机即可），使用VM的话：右键虚拟机>管理>克隆>创建完整克隆修改IP地址（/etc/sysconfig/netw.
复制链接

扫一扫

专栏目录