前言
现今Hadoop版本已经release到了Hadoop 3.x版本了,社区迭代更新的速度还是很快的。新的版本相对旧版本来说,能够给我们带来很多益处,诸如新的功能feature,众多bug fix以及一些大的performance的改进。始终维护运行一个陈旧的系统,意味着后期可能会遇到许多许多社区已fix的bug,这个将会消耗掉系统管理员日常相当多的工作时间。尤其当我们维护的是一个具有庞大规模的分布式系统。所以对于复杂系统来说,性价比最高的一种系统优化途径就是升级它,将它升级到新的稳定的版本。本文笔者来聊聊Hadoop升级前需要考虑和做的一些事情。
Hadoop升级的目标版本的选择
首先我们在进行Hadoop升级之前,第一个要十分明确的一个问题:我们要升级到哪个Hadoop版本。Hadoop社区每年都会发布很多大大小小的不同的Hadoop版本,我们到底要选择哪个版本作为升级后的版本呢?
这里一般会有如下几方面的考虑:
- 1)目标版本中带有我们期望中的某一个重要的功能,比如 HDFS的Standby NN Read,又或者是HDFS EC功能。
- 2)目标版本是一个相对发布了有一段时间,可以确认是一个稳定运行而且还算较新的版本。
上面1) 属于目标性十分明确的一个选择的,但是笔者个人偏向于上面的第二种做法,选择一个相对较新的版本作为目标升级版本会是一个更为稳妥的选择。毕竟谁也不想升级到一个最新社区的版本,然后不幸地遇到了别人都没遇到过的一个问题,这个时候修问题的成本就很高了。