一、存储备份的意义
随着信息技术的飞速发展,人们对计算机信息系统的依赖程度越来越强,如何有效地管理好计算机系统中的数字信息,已成为各单位非常关注的问题。
在有些单位的信息系统中管理的数据,其数据量大、来源广、种类多、结构复杂、应用广泛。其中很多数据是由几代人积累起来的,有些数据的采集甚至付出了血的代价,所以数据是非常宝贵的财富。
信息化给人们带来快捷的服务和方便的管理时,也给人们带来数字信息丢失的风险。数据的丢失会中断企业的正常运行,同时也会给企业造成巨大的经济损失。数字信息丢失、破坏,就无异于丢掉了过去、失去了现在,甚至断送了未来。数据丢失的主要原因可分为二大类,一类为存放数据的硬件设备出现故障,另一类是人为因素,如计算机犯罪、计算机病毒、软件错误及人为的误操作。其中,人为的误操作是最常见的现象。
每一位计算机的使用者都会有这样的经验:一旦在操作过程中敲错了一个键,几个小时甚至几天的工作成果便有可能付之东流。有些系统管理员在Unix系统root帐户下出现的误操作,则可能将整个系统中的数据破坏,造成灾难性后果。据统计,80%以上的数据丢失是由人们的错误操作引起的。遗憾的是,这样的错误操作对人类来说永远无法避免。在网络环境下,除了人为的错误操作之外,还有各种各样的病毒感染、系统故障、线路故障等,使数字信息的安全无法得到保障。因此,数据的存储、备份成为保证数据安全的重要措施。
二、存储备份在信息系统中的地位
存储备份(也称为数据备份)是容灾的基础,一切容灾系统的建立都是以数据备份为基础的。而建立容灾系统的最终目的不是备份,而是快速恢复数据。
存储备份分为两大类,一种是离线备份(Offline),如LAN-free、Server-free,即把存储服务器中的数据备份到磁带库中。采用这种备份方式,数据恢复的时间要比在线方式长,但它的投资较小,只要有存储备份设备和存储备份软件即可;另一种是在线备份(on-line),如数据复制。数据复制实际上就是一种同步的数据备份,其数据恢复的时间非常短,短则几秒、几分钟不等。数据复制是一个高级的同步过程,可使数据全整的保存,达到一点都不丢失的状态。在现在的大部份用户中,绝大部份用户使用数据离线备份即可。只有其业务需要连续性的关键业务用户(如银行、电信等),才会使用在线备份。
存储备份系统一般使用磁带库设备和存储备份软件,它是整个容灾体系中重要的后备支撑。当数据受到破坏,存储备份系统的任务就是把由数据丢失而造成的灾难降到最低,并在最短的时间内将系统中丢失和破坏的数据全部恢复,使系统能正常运行。
三、存储备份技术的结构选择
目前,存储数据的方式常见的有三种:
1.DAS(Direct-Attached Storage) 即直接连接存储技术,此为以主机为中心的传统存储方式,现在在各大银行的中心业务系统中常能见到这种方式。
2.NAS (Network Attached Storage) 即网络附加存储方式,此为以专业的网络文件存储及文件备份为中心的方式,是现在以文件存储为主的一种存储方式。
3.SAN(Stroage Area Network) 即存储局域网,指独立于异构计算网络系统之外几乎拥有无限存储容量的高速网络。其采用高速的光纤通道作为传输媒介,1)XFCP+SCSI协议作为存储访问协议,将存储子系统网络化、开放化、虚拟化、智能化,实现真正的高速、安全、共享存储,是今后主流存储模式。
在SAN的结构中,为了保护投资,首推OpenSAN的结构,在国土资源部机关搭建的存储局域网即为Open SAN结构。
Open SAN的概念即不管主机平台使用什么样的主机系统,是IBM服务器、SUN服务器、HP服务器、COMAPQ服务器还是其它服务器,如果SAN的架构都能接受这些主机系统,SAN结构对任何一家厂商的产品都能提供无缝连接,这样SAN的架构就是Open(开放的) (如图1所示)。
四、现有存储备份方式的缺点
目前大多数用户使用的计算机系统一般只用磁带机对数据进行冷备份,这种方式在数据量不大,操作系统种类单一,服务器数量有限的情况下,不失为一种既经济又简明的备份手段。但随着用户业务量的不断扩大,数据量呈几何级数增长,越来越多的业务会分布在不同的服务器上,不同的服务器使用的操作系统平台可能不同。这时,那种单机的人工冷备份方式越来越不能适应当今数据存储备份的要求,它存在种种弊端:
·数据存储管理工作难以制度化,数据丢失现象难以避免;
·数据分散在不同的服务器上、有应用不同,管理分散,安全性得不到保障;
·难以实现数据库数据的高效在线备份;
·维护人员寸步难离,工作效率下降;
·如今用来存储数据的介质越来越多,各种不同系统下存储产生的软盘、磁带、光盘将给存储介质的管理带来很大的困难;
·历史数据保留比较困难;
·如发生了来自非计算机系统因素的隐患,如火灾、地震等灾难后,信息系统的重建和数据恢复非常困难。
存储备份工作有不同的要求,物理故障会造成系统无法运行,容易发现。在发生故障后,要求能够迅速地恢复原有的业务系统;而逻辑故障不易发现,但只要有原始数据,同样可以恢复,这就要求要长期进行历史数据备份。因此拥有好的备份系统和备份方案,可以将灾难的损失减少到最低程度。
五、先进的存储备份管理系统
现在使用的先进的数据存储备份管理系统是指在Open SAN结构环境下,通过专业的数据存储备份管理软件,使用存储服务器、光纤交换机和存储备份设备,来对存储局域网上的数据进行集中管理,从而实现备份、文件归档、数据分级存储以及灾难恢复等功能的自动化。为在整个Open SAN存储局域网系统内实现全自动的数据存储管理,备份服务器、存储备份管理软件与智能存储设备的有机结合是完成先进的存储备份管理的基础。
存储局域网上,数据存储备份管理系统的工作原理,是在开放式的存储局域网上选择一台应用服务器,作为数据存储备份管理用的主服务器,其上安装数据存储管理服务器端软件,作为整个存储局域网上的备份服务器。备份服务器连接到存储局域网上的光纤交换机上。同时还应配置所需的大容量存储服务器(磁盘阵列)设备和存储设备(磁带库),这些设备应连接到存储局域网的光纤交换机上。在存储局域网中其他需要进行数据备份管理的服务器上,应安装备份客户端软件,通过存储局域网将数据集中备份管理到备份服务器可管理的存储设备上。
管理数据存储备份系统的核心软件是存储备份管理软件。通过存储备份管理软件的功能设置,可以建立起一个完善的存储备份及数据恢复计划策略,也可使所有的服务器备份都能按照使用者的设计进行备份管理。存储备份软件也可提供完善的灾难恢复手段,能够将备份设备硬件的优良特性完全发挥出来,使备份和灾难恢复时间大大缩短,实现数据备份的全自动智能化管理。目前在数据存储领域可以完成数据备份管理的软件产品主要有IBM Tivoli TSM、 Legato NetWorker、Veritas NetBackup、CA ARCserver等。 图2为典型的Open SAN架构上的存储备份系统。
在Open SAN架构上存储备份系统的目标应该是全方位、多层次的。首先,要使用硬件备份来防止硬件故障;如果由于软件故障或人为误操作造成了数据的逻辑损坏,则使用存储备份系统和硬件容错相结合的方式。这种结合方式构成了对系统的多级防护,不仅能够有效地防止物理损坏,还能够彻底防止逻辑损坏。
在系统安全建设中必不可少的一个环节就是数据的常规备份和历史保存。考虑到生产本地环境安全性原因,常规数据备份一般要求一份数据至少应有两个拷贝,一份放在生产中心以保证数据的正常恢复和数据查询恢复,另一份则要移到异地保存,以保证在生产本地出现地震、火灾等灾难后最低限度的数据恢复。此外,更应建立历史归档数据的异地存放制度,从而确保对历史业务数据的可靠恢复与有效稽核的实现。
综上所述,理想的备份系统应该具备以下功能:
·集中式管理
存储备份管理系统对整个存储局域网的数据进行集中管理。利用集中式管理工具的帮助,系统管理员可对存储局域网的备份策略进行统一管理,备份服务器可以监控所有机器的备份作业,修改备份策略,并可即时浏览所有目录。所有数据可以备份到同备份服务器或应用服务器相连的任意一台磁带库内。
·全自动备份
备份系统能根据用户的实际需求,定义需要备份的数据,然后以图形界面方式设置备份时间表,备份系统将自动启动备份作业,无需人工干预。这个自动备份作业是可自定的,包括一次备份作业、每周的某几日、每月的第几天等。设定好计划后,备份作业就会按计划自动进行。
·数据库备份和恢复
在许多人的观念里,数据库和文件还是一个概念。当然,如果你的数据库系统是基于文件系统的,当然可以用备份文件的方法备份数据库。但发展至今,数据库系统已经相当复杂和庞大,再用文件的备份方式来备份数据库已不适用。是否能够将需要的数据从庞大的数据库文件中抽取出来进行备份,是备份系统是否先进的标志之一。
·在线式索引
备份系统应为每天的备份在服务器中建立在线式的索引,当用户需要恢复时,只需点取在线式索引中需要恢复的文件或数据,该系统就会自动进行文件的恢复。
·归档管理
用户可以按项目、时间定期对所有数据进行有效的归档处理。提供统一的Open Tape Format数据存储格式,从而保证所有的应用数据由一个统一的数据格式来作永久的保存,保证数据的永久可利用性。
·有效的媒体管理
备份系统对每一个用于作备份的磁带自动加入一个电子标签,同时在软件中提供识别标签的功能,如果磁带外面的标签脱落,只需执行这一功能,就会迅速知道该磁带的内容。
·SPM分级存储管理
所谓分级存储管理系统是一套自动化的存储管理设备,会自动判断硬盘中资料的使用频率,自动将不常用的资料移至速度较慢的光盘,而最不常用的资料则移到磁带中。在线的资料经过一段时间的搬移后,即可达到最佳化。对遥感、GIS、全球定位系统等易产生大量数据的应用而言,资料多属于极占空间的图形影像。基于管理及成本的考虑,SPM (Storage Space Management,分级存储管理)系统是一个合适的在线备份解决方案。它利用硬盘、可擦写磁光盘、磁带进行三层式存储管理。
·系统灾难恢复
网络备份的最终目的是保障网络系统的/顷利运行,所以优秀的网络备份方案应能够备份系统的关键数据。当网络上的设备出现故障、或人为误操作、应用软件被损坏时,能够迅速地恢复服务器中各应用软件要调用的原始数据。从发现故障到完全恢复系统,理想的备份方案耗时不应超过半个工作日。
·满足系统不断增加的需求
备份软件必须能支持多平台系统,当存储局域网上连接了其它的应用服务器时,对于网络存储管理系统来说,只需在其上安装支持这种服务器的客户端软件即可将数据备份到磁带库中。
存储备份系统的备份策略及灾难恢复方式:备份策略:数据备份有全备份、增量备份、差分备份、按需备份等多种方式。全备份是备份系统中所有的数据;增量备份是只备份上次备份以后有变化的数据;差分备份是只备份上次完全备份以后有变化的数据;按需备份是根据临时需要有选择地进行数据备份。
全备份所需时间最长,但恢复时间最短,操作最方便,当系统中数据量不大时,采用全备份最可靠;但是随着数据量的不断增大,将无法每天做全备份,而只能在周末进行全备份,其它时间则采用所用时间更少的增量备份或采用介于两者之间的差分备份。各种备份的数据量不同:全备份>差分备份>增量备份。在备份时要根据它们的特点灵活使用。
数据存储基本策略的设定应按自己的实际情况设定,以下介绍的为常规方式如下设定:
数据库全备份一般选择在周五(或周六)自动进行;数据库增量备份一般每晚作批前和批后,由Unix或其它主机系统执行,批处理由人触发或由系统自动执行;文件全备份一般用于主机系统和其它服务器的数据备份,选择在周日自动进行;文件增量备份一般在周一到周四(或周五)之间备份文件的增量;系统全备份一般在月初的周日备份系统及数据库的全量;系统增量备份一般在其余的时间仅备份系统和数据库配置的增量。
数据恢复操作通常可以分为三类。第一类是全盘恢复,第二类是个别文件恢复以及重定向恢复。全盘恢复一般应用在服务器发生意外灾难导致数据全部丢失、系统崩溃或是有计划的系统升级、系统重组等,也称为系统恢复。个别文件恢复要比全盘恢复常见得多,利用网络备份系统的恢复功能,我们很容易恢复受损的个别文件。只需浏览备份数据库或目录,找到该文件,触动恢复功能,软件将自动驱动存储设备,加载相应的存储媒体,然后恢复指定文件。重定向恢复是将备份的文件恢复到另一个不同的位置或系统上去,而不是进行备份操作时当时所在的位置。重定向恢复可以是整个系统恢复也可以是个别文件恢复。重定向恢复时需要慎重考虑,要确保系统或文件恢复后的可用性。
六、存储备份软件Tivoli TSM
Tivoli Storage Manager是一个功能强大的全面的存储管理软件,可以处理分布式环境中存储管理所带来的复杂问题。它可以保护并管理小到用户终端大到企业级服务器上的所有数据。支持多达39种以上不同的操作系统,并且都具有方便的图形用户界面。Tivoli Storage Manager存储管理软件全面兼容上百种存储设备,支持局域网(LAN),广域网(WAN)、和存储局域网(SAN),也可为主要群件、企业资源规划(ERP)应用和数据库产品定制备份方案。
Tivoli存储管理软件的特点是:
完全增量备份策略只备份新的文档和被修改的文件,节省了时间和磁盘空间。这种完全增量备份策略是利用Tivoli Storage Manager内特有的关系数据库跟踪数据,不论其被存储在任何位置,采用一步到位的方法备份数据和恢复数据。这种方法避免了其他存储管理软件产品中所必需的全量—差分恢复过程的缺点。
磁带资源共享允许多台Tivoli存储管理服务器使用同一磁带库和驱动器,提高了磁带硬件设备的利用率。
无网络快速恢复支持利用磁带或光驱进行快速的客户端数据恢复功能。通过不利用网络和中心服务资源的方式减少了恢复的时间。
无局域网(LAN-free)数据传输能发挥存储局域网的高效率,将数据备份传送由使用普通通讯网络转变为使用专用的数据网络或存储局域网(SAN),从而减少备份对企业IP通讯的带宽占用。
动态的多线程传输是允许多个客户端同时在同一台Tivoli存储管理服务器上进行数据的读写传输。这一新的特性使得备份性能比原来的单线程通道下提高了三倍。之所以能得到这么高的速度是由于Tivoli存储管理软件数据的传输进程在有限的系统资源上进行了最大优化。
灵活的差分传输技术在于数据在企业内部的传输过程中传输方式是可以变化的。根据数据的大小和网络的特点,数据的传输能够以字节级数据块级或文件级进行。这一新型的专利技术支持局域网(LAN)、广域网(WAN)、存储局域网(SAN),拨号上网等各种连通方式。灵活的差分传输技术主要是针对移动计算机用户和那些需要压缩通过网络传输数据的用户而设计的。
企业级管理是对于实施多个Tivoli StorageManager,可以实现简化的中央控制,并且无须牺牲网络的性能。这使得本地的附属存储设备利用最少的网络资源实现高速的备份性能。
Tivoli存储备份管理软件可以和其他若干可选择的附件集成在一起构成一个强有力的集成存储管理解决方案。附件中包括Tivoli灾难恢复管理模块、Tivoli空间管理模块、用于存储管理分析的Tivoli决策支持模块、以及用于数据库、应用软件和群件的Tivoli数据在线保护模块。
Tivoli Storage Manager服务器运行的平台有:微软Windows NT 4.0、Windows 2000;IBM AS/400;IBM AIX、Sun Solaris;IBM OS/390、IBM VM/ESA。
支持的客户端环境有:Microsoft Windows2000、Microsoft Windows 95、Microsoft Windows98、Microsoft Windows NT、Digital Tru64 UNIX(原Digital UNIX)、 Microsoft Windows NT DECAlpha、Linux(r)、Apple Macintosh、OS/390 UNIXSystem Service、HP-UX、IBM AIX、IBM AS/400等近30种。