Hadoop文件系统

Hadoop有一个抽象的文件系统概念,HDFS只是其中的一个实现。Java抽象类org.apache.hadoop.fs.FileSystem定义了Hadoop中一个文件系统的客户端接口,并且抽象类有几个具体实现,下面我们以列表来展示一下:

 

Hadoop文件系统抽象类
文件系统URI方案Java实现详细描述
Localfilefs.LocalFileSystem

使用客户端校验本地磁盘文件系统。

使用RawLocalFileSystem表示无校验本地文件系统

 

HDFShdfshdfs.DistributedFileSystemHadoop的分布式文件系统。将HDFS设计成与MapReduce结合使用。可以实现高性能
WebHDFSWebhdfsHdfs.web.WebHdfsFileSystem基于HTTP的文件系统,提供对HDFS的读写访问
Secure WebHDFSswebhdfshdfs.web.SWebHdfsFileSystemWebHDFS的HTTPS版本
HARharfs.HarFileSystem一个构件在其他文件系统之上用于文件存档的文件系统。Hadoop存档文件系统通常用于将HDFS中的多个文件打包成一个存档文件,以减少namenode内存的使用。使用Hadoop的achive命令来创建HAR文件
Viewviewfsviewfs.ViewFileSystem针对其他Hadoop文件系统的客户端挂载表。通常用于为联邦namenode创建挂载点。
FTPftpfs.ftp.FTPFileSystem由FTP服务器支持的文件系统
S3S3afs.s3a.S3AFileSystem由Amazon S3支持的文件系统。替代老板本的s3n实现
Azurewasbfs.azure.NativeAzureFileSystem由Microsoft Azure支持的文件系统
Swiftswiftfs.swift.snative.SwiftNativeFileSystem

由OpenStack Swift支持的文件系统

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Hadoop对文件系统提供了许多接口,它一般是通过URI方案来选取合适的文件系统实例来进行交互。

举个例子,我们要列举出本地文件系统根目录下的文件,可以输入以下命令:

% hadoop fs -ls file:///

尽管运行的MapReduce程序可以访问任何文件系统,但在处理大数据集时,建议还是选择一个有数据本地优化的分布式文件系统,如HDFS。

 

--摘自《Hadoop权威指南》

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值