模型,功能和内部机制首先,我们讨论一个通用的云存储架构,设置上下文以供后面探究独特的架构特性。不从效用角度谈论架构是很难的。我的意思是,通过各种特征度量一个架构,包括成本、性能、远程访问,等等。因此,我首先定义一组可度量云存储模型的标准,然后探究云存储架构内的一些有趣的实现。
通用架构
图 1. 通用的云存储架构
表 1. 云存储特征
特征 | 说明 |
可管理性 | 以最少的资源管理系统的能力 |
访问方法 | 公开云存储所用的协议 |
性能 | 根据宽带和延迟衡量的性能 |
多租户 | 支持多个用户(或承租者) |
可扩展性 | 通过扩展满足更高要求或以得体的方式加载的能力 |
数据可用性 | 对一个系统的正常运行时间的衡量 |
控制 | 控制系统的能力 — 特别是为成本、性能或其他特征进行配置 |
存储效率 | 度量如何高效使用原始存储 |
成本 | 度量存储成本(通常以美元每 GB 为单位) |
云存储(或数据存储即服务)是对接口后的存储的抽象,可在该接口内按需管理存储。此外,接口抽象化存储的位置,这样一来,不管存储是在本地还是远程(或混合)都无关紧要。云存储基础架构引入新的架构,能够支持为大量潜在用户提供不同水平的服务,以及地理上分散的存储容量。了解云存储架构的关键架构属性 — 从数据保护和完整性到存储优化。
以目前数据增长的速度来看,云存储越来越流行不足为奇。增长速度最快的数据是归档数据,鉴于很多因素它是云存储的理想之选,这些因素包括成本、访问频率、保护和可用性。但是并非所有云存储都是相同的。一家提供商可能主要关注于成本,而另一家提供商关注于可用性或性能。没有一个架构具有单一侧重点,但是一个架构实现给定特征的程度定义了其市场和适当的使用模型。
云存储架构主要关乎以一个高度可扩展和多租户的方式按需交付存储。通用(参见 图 1)的云存储架构包含一个导出 API 以访问存储的前端。在传统的存储系统中,这个 API 是 SCSI 协议;但是在云环境中,这些协议在演化。在那里您可以找到 Web 服务前端、基于文件的前端,甚至更多传统前端(比如 Internet SCSI 或 iSCSI)。在前端后面是一个中间件层,我将它称作存储逻辑。该层通过传统的数据放置算法(考虑地理布局)实现各种功能,比如复制和数据简缩。最后,后端实现对数据的物理存储。这可能是一个实现特定功能的内部协议或物理磁盘的一个传统后端。
从图 1 中,您可以看到当前云存储架构的一些特征。注意,没有特征在特定层中是独有的,而是充当本文探讨的特定主题的指导。
http://www.ibm.com/developerworks/cn/cloud/library/cl-cloudstorage/