HDFS
1.什么是HDFS
HDFS: Hadoop分布式文件系统(Distributed File System) - HDFS (Hadoop Distributed File System)
2.HDFS的来源
源于Google 三大论文的GFS论文,HDFS是GFS的克隆版
3.HDFS的设计目标
1.自动快速检测应对硬件错误(硬件错误为常态)
2.流式处理访问数据()
3.移动计算比移动数据本身更划算 (不需要来回拷数据,直接拷jar包)
4.简单一致性模型 (可读,写,复制等不可修改)
5.异构平台可移植 (可使用别的软件替换重写一些模块)扩展性比较好
4.HDFS的特点
优点:
(一)高可靠性:Hadoop按位存储和处理数据的能力值得人们信赖;
(二)高扩展性:Hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以千计的节点中。
(三)高效性:Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。
(四)高容错性:Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。
缺点:
(一)不适合低延迟数据访问。
(二)无法高效存储大量小文件。
1.什么是HDFS
HDFS: Hadoop分布式文件系统(Distributed File System) - HDFS (Hadoop Distributed File System)
2.HDFS的来源
源于Google 三大论文的GFS论文,HDFS是GFS的克隆版
3.HDFS的设计目标
1.自动快速检测应对硬件错误(硬件错误为常态)
2.流式处理访问数据()
3.移动计算比移动数据本身更划算 (不需要来回拷数据,直接拷jar包)
4.简单一致性模型 (可读,写,复制等不可修改)
5.异构平台可移植 (可使用别的软件替换重写一些模块)扩展性比较好
4.HDFS的特点
优点:
(一)高可靠性:Hadoop按位存储和处理数据的能力值得人们信赖;
(二)高扩展性:Hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以千计的节点中。
(三)高效性:Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。
(四)高容错性:Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。
缺点:
(一)不适合低延迟数据访问。
(二)无法高效存储大量小文件。
(三)