本文是对【精】HDFS无需重启NN进行动态刷新拓扑信息一文的补充,用来简要地介绍一些代码鲁棒性相关的内容。
一定要记住,我们在开发一个新功能时,一定不能简单地以实现了该功能为终点。而是要从很多方面去多维度考虑。例如:安全性、鲁棒性(各种异常情况都能被考虑到)、性能、可扩展性等等。
那以我们实现的refreTopology为例。在review代码的时候,leader提出了很多安全性、鲁棒性相关的建议。这里作下记录。
① 原始实现中,直接执行如下命令即可
hdfs dfsadmin -refreshTopology
这里面涉及到一个问题,执行这条命令时去刷新的集群是哪个呢?在代码里是去conf里找default.FS配置项对应的namespace。然而我们在hdfs-site.xml配置中配置了几个namespace,并且与default.FS不同。这样refreshTopology命令就没法指定某个具体的namespace去执行了。
为了改进这点,我们重新实现了一版,让refreshTopology命令必须带nsid参数。
hdfs dfsadmin -refreshTopology nsid
② 既然指定了nsid,那如果nsid在conf里找不到的话,要抛出异常让客户端知道。
③ RouterRpcServer中的refreshTopology不再支持此操作,抛出UnsupportedOperationExcept