视图文件系统(View File System ,ViewFs)提供了管理多个Hadoop文件系统命名空间的方式,该系统在HDFS联盟的集群中有多个NameNode(因此有多个命名空间)是特别有用。ViewFs与某些Linux或Unix系统的客户端挂载表类似,可以被用于创建个性化的命名空间视图和整个集群共同的视图。本篇文章基于拥有几个集群,集群互相联合形成多个命名空间的Hadoop系统,也学习了在HDFS联盟中使用ViewFs提供整个集群的全局命名空间,这样应用程序可以以与在联盟中相似的方式操作。
在HDFS联盟出现之前(也就是hadoop-1.x中),整个集群中只有单一的NameNode,该NameNode为集群提供了单一的文件系统命名空间。假设存在多个集群,每个集群的文件系统命名空间是完全独立和不相交的,而且集群间不共享物理存储,比如集群间不共享DataNodes。每个集群中的core-site.xml设置了该集群中NameNode的默认文件系统:
<property>
<name>fs.default.name</name>
<value>hdfs://namenodeOfClusterX:port</value>
</property>
该配置参数允许使用以斜线开头的相对路径,并将该路径解析为相对NameNode的路径,例如/foo/bar解析为hdfs:/

本文介绍了Hadoop-2.4.1中的ViewFs,一种管理多Hadoop文件系统命名空间的方法,尤其适用于HDFS联盟中的集群。ViewFs类似于Linux/Unix的客户端挂载表,用于创建个性化和全局的命名空间视图。文章讨论了在HDFS联盟前后的路径使用变化,并展示了如何配置和使用ViewFs挂载表。
订阅专栏 解锁全文
725

被折叠的 条评论
为什么被折叠?



