概述:本文探讨如何将虚拟机上的hdfs挂载为主机操作系统的一个分区,并给出可能用到的接口软件,以及这些接口软件与Hadoop配合工作时可能遇到的问题。在VirtualBox环境下搭建好hadoop环境后,想要在主机操作系统方便的浏览到存储在hadoop的内容,并对hdfs文件系统进行读写操作,这里涉及到多个接口软件。第一步是把hdfs文件系统挂载为一个Unix文件系统,第二步是对这个挂载的文件夹进行网络访问。本文的技术方案可以总结为:hadoop+FUSE(或WebDAV)+iSCSI(或Samba)
测试环境:CentOS 6.4
Hadoop集群说明:一个namenode和三个datanode协同工作,以下所列接口软件都安装在namenode上
一、从hdfs到Unix文件系统
(1)用FUSE挂载hdfs文件系统
用户空间文件系统(FUSE)允许把按照用户空间实现的文件系统整合成一个Unix文件系统。通过使用Hadoop的Fuse-DFS功能模块,任意一个Hadoop文件系统均可以作为一个标准文件系统进行挂载。随后便可以使用Unix工具(如ls和cat)与该文件系统进行系统交互,还可以通过任意一种编程语言调用POSIX库来访问文件系统。如何用FUSE挂载hdfs,配置过程可以参考以下几个配置文档:
http://www.360doc.com/content/12/1217/13/834950_254552340.shtm