本文介绍hdfs的存储策略
译注:存储策略是在和经济妥协的一个技术产物。由于存储技术发展的日新月异,也许将来再考虑这种策略不是很有必要了。虽然从逻辑上来说,总是有相似的问题出现。但将来对于绝大部分问题而言,这些问题已经不是问题了。
1.简介
归档存储用于减少对存储的压力。具有高密度存,不那么贵的存储的节点,这些接节点的计算能力也一般般,这种节点可以在集群中承当冷存储(冷宫,冷点)。
可以根据策略要求,数据能从热点移动到冷点。
为更多的节点添加冷存储,可以提升集群存储。
这个框架由多种存储和归档存储构成,其中还包含SSD和内存。
用户可以选择在SSD和内存中存储数据,以便提升性能。
译注:原文说了那么多,有用的就是两点:存储、性能。 这种策略在很多其它系统都是透明的,也不需要它们自己管理。例如rdbms可以不它们的数据存储的任意地方,不需要特别设定策略。
hdfs之所以要这么做,是因为hdfs的应用现在变得更加多样,有的人期望提供类似即席查询的能力,而有的人仅仅要求偶尔计算一下。
2.存储类型和存储策略
译注:原文的一段内容没有特别含义,稍微啰嗦,所以摘其精要。
存储类型
DISK-普通磁盘,存储
SSD -SSD盘
RAM_DISK 内存盘
ARCHIVE -归档/压缩,不是实际的磁盘类型,而是数据被压缩存储。
存储策略
存储策略允许不同的文件存储在不同的存储类型上。
目前有以下策略: