一、HDFS简介
HDFS是基于流数据模式访问和处理大文件的需求而开发的,它可以运行与廉价的商用服务器上。
特点:
(1)处理超大文件
(2)流式地访问数据
(3)运行于廉价的商用机器集群上
缺点:
(1)不适用低延迟数据访问
(2)无法高效存储大量小文件
(3)不支持多用户写入及任意修改文件
二、HDFS相关概念
(1)块
文件以块的形式存储在磁盘中,64MB/块
(2)NameNode和DataNode
HDFS是基于流数据模式访问和处理大文件的需求而开发的,它可以运行与廉价的商用服务器上。
特点:
(1)处理超大文件
(2)流式地访问数据
(3)运行于廉价的商用机器集群上
缺点:
(1)不适用低延迟数据访问
(2)无法高效存储大量小文件
(3)不支持多用户写入及任意修改文件
(1)块
文件以块的形式存储在磁盘中,64MB/块
(2)NameNode和DataNode