1 概述
图灵奖获得者Jim Gray提出了一个新的经验定律:网络环境下每十八个月产生的数据量等于有史以来数据量之和。信息资源的爆炸性增长对存储系统在存储容量、数据可用性以及I/O性能等方面提出了越来越高的要求。
1.1 信息时代对网络存储的要求
数据的存取只应该受到安全机制的限制,而不应该受到地域空间的约束。在数字化和网络互联时代、在多用户并行环境中,大规模应用系统的广泛部署对网络存储系统的性能和功能提出了巨大挑战,主要表现为:
- 高性能:各种实时性要求严格的应用系统要求SAN存储系统提供高性能的处理和传输能力以满足实时性要求,尤其在大数据量和高突发性的应用系统中,吞吐量和命令处理速率是非常关键的指标。
- 可扩展性:存储系统必须能够根据应用系统的需求动态扩展存储容量、系统规模及软件功能。如在许多应用系统如数字图书馆、石油勘探地震资料处理等应用,需求PB以上级别的海量存储容量。
- 可共享性:存储资源可以方便的被前端异构平台的主机共享使用。
- 自适应性:存储系统能够根据各种应用系统的动态工作负载和内部设备能力的变化动态改变自己的配置、策略以提高I/O性能。
- 可管理性:当存储容量、存储设备、服务器以及网络设备越来越多时,系统管理变得复杂,因此系统需要提供高可管理性,以减少系统管理和配置的时间。
- 可靠性/可用性:许多应用系统需要24×365连续运行,要求存储系统具有高度的可用性,以提供不间断的数据存取服务。
2 网络存储技术的发展
现在网络存储技术主要有三种:直连式存储(DAS:Direct Attached Storage)、网络存储设备(NAS:Network Attached Storage)和存储网络(SAN:Storage Area Network)。
2.1 直连式存储 DAS
DAS(Direct Aaached Storage一直接连接存储)被定义为直接连接在各种服务器或客户端扩展接口下的数据存储设备,是指将存储设备通过SCSI接口或光纤通道直接连接到服务器上的方式。如图2,它完全以服务器为中心,寄生在相应服务器或客户端上,其本身是硬件的堆叠,不带有任何存储操作系统。其特征为存储设备为通用服务器的一部分,该服务器同时提供应用程序的运行,即数据访问与操作系统、文件系统和服务程序紧密相关。当用户数量增加或服务器正在提供服务时,其响应速度会变慢.在网络带宽足够的情况下,服务器本身成为数据输入输出的瓶颈。现在已渐渐不能满足用户的需求,不再为大家所采用。DAS存储没有刚络结构。存在许多缺点:一方面该技术具备共享性,每种客户机类型都需要一个服务器,从而增加了存储管理和维护的难度;另一方面,当存储容量增加时,扩容变得十分困难。而且当服务器发生故障时,数据也难以获取。因此,DAS难以满足现今的存储要求。
2.2 网络附加存储 NAS
在这种新的存储结构中,存储系统不再通过I/0总线附属于某个特定的服务器或客户机,而是直接通过网络接口与网络直接相连,由用户通过网络访问。与DAS系统相比,NAS具有非常好的可扩展性(Scalability),并且由于数据不再通过服务器内存转发(这会引起额外延迟和阻塞),数据直接在客户机和存储设备间传送(即所谓第三方传送),服务器仅起控制管理的作用,因而具有更快的响应速度和更高的数据带宽。另外对服务器的要求降低,可大大降低服务器成本,这样就有利于高性能存储系统在更广的范围内普及应用。
2.3 存储区域网络 SAN
存储局域网是一种利用Fiber Channel等存储协议连接起来的可以在存储资源和服务器之间建立直接的数据连接的高速计算机网络。光纤通道把多个存储设备和服务器连接在一起形成一个存储局域网,其中存储设备共同构成一个存储池,都可以很方便的添加到网络中去,因此具有较好的可扩展性。存储设备从服务器中分离出来,与服务器形成一个多对多的关系,存储设备上的数据容易被其他服务器共享,迁移也变得很容易。采用