1       TSM系统备份介绍
对于具体的备份环境和结构,我们提出以下基于SAN环境的备份结构。
当我们采用SAN环境作为备份环境的结构时,我们建议使用将一台UNIX或者Windows服务器作为IBM ITSM服务器。IBM ITSM服务器和磁带库都通过光纤交换机连接。
在这个方案中,我们使用了以下的IBM Tivoli存储产品
IBM Tivoli Storage Manager
IBM Tivoli Storage Manager for Databases
IBM Tivoli Storage Manager for SAN
 
ITSM Server需要安装在备份服务器上
ITSM Client需要安装在所有的服务器上
ITSM for Database需要安装在Oracle和MS SQL服务器上
ITSM for SAN需要安装在连接在光纤交换机的服务器上
 
ITSM是一个企业级的Client/Server结构跨平台网络备份、恢复及存储管理软件。ITSM Client主要功能是向ITSM Server提供需要集中备份的数据,或向ITSM Server索取已备份数据及归档数据以便Client恢复数据,目前支持多达 39种平台,支持的存储设备也达250多种,基本覆盖了时下流行的多种平台和存储设备,覆盖范围从台式机到大型主机,可以满足现有环境的存储管理的需求,也为今后的拓展提供了技术的储备。ITSM Server负责管理ITSM Client的备份数据、备份策略及统一管理连接在ITSM Server上的各类存储产品。
系统管理员通过WEB浏览器登录ITSM Server进行管理。他为不同的ITSM Client设置相应的备份策略,例如自动备份进行的时间,备份数据保留的长短等等。如下图:
系统管理人员还可通过Web界面帮助ITSM Client做数据备份和恢复。所以ITSM的管理员无论身在何处,使用何种机器,只要能够访问到ITSM服务器,就可以使用Internet浏览器管理和使用ITSM。配合内嵌在ITSM内部的免费的企业级管理功能(Enterprise Management),一名管理员可方便地管理用户内多台ITSM服务器。
在进行数据恢复时,ITSM给用户列出修正数据后的版本,文件修改时间,方便管理员查询备份数据。并提供了一个类似于IE的操作界面:
 
1.2方案特点
 
☆ 能满足客户对海量数据的管理要求。
☆ 可以制定统一的存储管理策略,并可以统一部署 ITSM 服务器上,实现统一的集中管理。
☆ 可以实现高度自动化的集中式数据保护。
☆ 高效的存储设备管理功能。
☆ 高度的扩展性,保证未来系统发展的需求,并考虑到将来灾难恢复系统的建设。通过 ITSM 独有的 SERVER TO SERVER 功能,可以方便的将现有存储系统升级成灾难恢复系统,充分保护用户在系统管理的投资。
 
日常备份操作由备份系统自动完成,操作人员按照要求在备份服务器上制定备份策略,全网的备份由备份服务器统一管理。各客户端也可以自行手工启动备份。备份服务器(包括主服务器和共享服务器)的数据(文件和数据库资料)直接进入磁带库,各客户端的资料由网络传到备份主服务器,进入磁带库,对于一些小文件,我们可以先将这些小文件备份到备份服务器的本地硬盘存储池中,待达到一定百分比时,在一次性迁移到带库中;而对于一些大文件,可以直接备份到带库中。这样可以大大提高数据的备份效率,提高存储设备的利用率。为提高备份质量、保证数据安全,可以采用 ITSM 软件的自动的副本存储池复制功能,同时进行备份复制,一份近线保管,另一份离线保管(所有管理均由备份软件完成)提高系统容灾能力。
 
对于计算机应用系统这样的一个关键应用来说,制定一个良好的备份策略是至关重要的。备份工作的主要内容包括主机和数据库系统备份两个方面:
 
主机、数据库系统备份策略
为了在主机、数据库系统发生故障时,能够迅速、有效的使系统得到恢复,需要对主机、数据库系统进行备份。由于主机、数据库极少发生变动,所以它的备份策略也比较简单。
1 )、在主机、数据库安装调试完毕后,将主机、数据库系统的备份到磁带上。
2 )、在对主机参数、数据库参数进行修改后,及时将主机、数据库系统备份到磁带上。
3 )、定期对主机、数据库系统进行全备份。这些全备份可以通过 ITSM 的定时自动完成。
 
根据 用户的 业务特点,系统的数据备份要求较高,下面我们分别说明数据备份策略:
1 )、 应用服务器 Oracle 数据库 的备份
Oracle在归档模式下运行,利用IBM Tivoli Storage Manager for Databases模块调用RMAN进行在线的热备份,可以在备份时,对备份数据保存在不同的存储对象中,以满足客户容灾的要求,可以利用ITSM的多线程的数据迁移、利用多个磁带驱动器同时读写提高其数据备份的效率。
针对Oracle的总数据量和增量数据量大小,可以利用Oracle的多达三级的增量备份机制,结合ITSM强大的备份数据追踪寻址能力和介质管理功能,制定灵活的备份策略,实现全自动的备份数据的全生命周期管理。
根据客户的数据量和网络条件,建议:Oracle的备份以周为备份周期,星期一到星期六做数据库累积增量、归档日志、控制文件和CATALOG用户所有对象的备份,星期天做全备份,保留前面一周期和当前周期的备份,每个周期有两份容余。而且由于该应用的Oracle系统版本较新,也可以利用一些最新的Oracle备份技术,将同样的一份备份数据同时保存在不同的存储介质中去,如磁带和硬盘,以保证备份数据的完整性和安全性。对于Oracle系统的数据备份和恢复的性能,可以通过开辟多个Oracle数据备份通道和多重数据迁移的技术得到保障。
对于以上的备份文件文件,根据管理的要求设定其保存时间,当此类数据过期时,ITSM将自动进行清理,无须管理人员参与。备份时可以利用ITSM的永远增量备份的功能、多线程的数据迁移提高数据备份的效率,也可以利用ITSM独特的磁带分类集中存放技术保证数据存放的合理性,减少磁带的占用,提高数据恢复的效率。如果此类文件较小的话,可以利用ITSM独特的磁盘池的功能,先将这些小文件备份到备份服务器的本地硬盘存储池的ITSM临时存储池中,待达到一定百分比时,在一次性迁移到带库中。
2)、对于文件系统和裸设备的备份,可以直接利用ITSM Client进行备份。
备份通过ITSM的定时机制自动完成。
 
当操作系统或应用出现问题时导致不可用时,需要通过ITSM进行数据的恢复,在本方案中,数据的恢复策略可以根据不同的情况而制定:
出现此情况,可以通过本地的ITSM Server结合ITSM for Databases利用备份数据进行数据恢复。恢复时,ITSM可以实现多线程的数据恢复,可以利用ITSM独特的磁带分类集中存放技术,减少磁带的就位时间,提高数据恢复的效率。
先用最近一次的全备份恢复+恢复最近一次的增量备份+增量备份到断点的ARCHIVE LOG来恢复(要求数据库在ARCHIVE LOG模式下工作)。这种恢复方式比全部用ARCIVE LOG恢复要快。
如果两份容余的最近一次增量备份都不可用,可以追溯再上次的增量备份来恢复,然后用增量备份到断点的ARCHIVE LOG恢复。
如果最近一次的全备份恢复都不可用上个周期的全备份+上个周期的最后一次增量备份+本周期的最近一次增量备份+增量备份到断点的ARCHIVE LOG来恢复。
如果增量备份都不可用,那么可以用全备份+ARCHIVE LOG来恢复。
如果是硬件或网络的故障,必须首先排除硬件或网络的故障。然后,进行操作系统的恢复,在此基础上,利用IBM Tivoli Disaster Recovery Manager,可以来帮助管理人员实现数据恢复计划的建立和实施。包括实现ITSM系统和应用系统的自动重建。通过DRM的实时的灾难恢复计划,有效的管理各种在线和离线的存储介质,为应用系统的恢复提供强有力的保障。而无须系统管理人员在大量的磁带中寻找合适的磁带进行应用系统的恢复。并且,灾难恢复计划是一个非常实用的灾难恢复流程顾问工具,通过DRM,不仅可以自动的恢复ITSM系统和应用系统的数据,而且,可以帮助用户进行存储管理流程的建立和优化,实现规范化的存储管理。
ITSM 提供对各种高性能外围存储设备的支持,ITSM支持39多种客户机平台和8种服务器平台,并且支持250多种存储设备,再一次体现了在配置方面灵活性。 目前,ITSM Server和Client之间可以通过多达7种网络传输协议进行备份数据的传输,支持以LAN、SAN和拨号网络等多种连接方式。
ITSM 服务器可以监控所有应用服务器的备份作业,也可以修改其备份策略,同时,ITSM提供多种的定时数据备份方式,客户甚至可以方便根据自身的存储管理要求编写备份脚本且纳入ITSM的定时机制中,这些定时机制可以在ITSM、应用、操作系统三个层次中实现,以可以满足客户对存储管理的特定要求。
ITSM 可以通过WEB BROWSER登录到任何一台ITSM Client进行数据的备份和恢复。同样的,也可以通过WEB BROWSER登录到ITSM SERVER上进行管理。这意味,只需在一台机器上,就可以实现ITSM系统的集中式远程管理。
☆ ITSM提供后台关系数据库的支持,从而使恢复和备份速度大大加快,有效的减少管理成本。
☆ 支持备份和恢复过程中的断点再续。
☆ 在备份和恢复过程中,ITSM都提供了多线程的数据流支持。
☆ 通过磁带的数据分类集中存放,可以将同类型的数据集中存放在一组或一个磁带上,从而在恢复时保证以最少的磁带恢复,大大加快了恢复速度。
☆ 通过磁带数据的自动重整,减少磁带碎片,提高磁带的利用率,节约客户成本,保证数据的可用性。
☆ 支持在SAN环境下的LAN-FREE数据迁移。
☆ 提供永远的增量备份,通过先进的技术手段减少需备份的数据量,最大限度的提高备份工作的效率。应用永远增量备份技术,可以大大减少磁带的消耗,减少备份时对网络的占用,减少总体拥有成本,满足今后用户发展的需要,实现最大限度的投资保护,备份数据的减少可以提高系统的恢复效率,这可以提高应用的可用性,实现应用级的快速恢复。
☆ 提供 Web Proxy Server (ITSM代理服务器),减轻在多个备份进程同时发生时ITSM服务器的负担。
☆ ITSM提供了SELF-TUNING的调试工具,可以指导系统管理人员进行性能优化。在ITSM的系统配置文件,提供了一系列的参数优化ITSM系统。
 
ITSM 通过IBM Tivoli Data Protection模块对应用数据库进行在线热备份,目前,ITSM支持 Oracle 、Informix、Lotus Domino/Notes、MS SQL 、MS Exchange Server、SAP R/3 on Oracle/DB2, 对于DB2数据库,ITSM可以提供全面的支持,直接通过ITSM就可以实现DB2的在线热备份。
对于Oracle、Lotus Domino、Informix、MS Exchange Server、SQL,ITSM结合ITSM支持应用的系列模块,可以实现在SAN下的LAN-Free数据迁移。
管理的安全是保护应用数据的重要因素,ITSM提供管理员的多重的权限定义,实现多层次的管理方式,ITSM的管理员和ITSM Client的用户严格区分。因此,客户可以根据实际的存储环境和安全要求定义不同级别的管理员和用户。同时它允许用户授权进行数据恢复。ITSM提供集成的一系列安全防范措施,提供对IP地址窃取、中断、加密等影响安全的操作,保证备份的安全管理。
ITSM 的数据传输格式为经过加密处理的ITSM独有的二进制格式,可以保证数据在备份和恢复过程中的完整性和安全性。而且,在每次数据备份和恢复时,ITSM都会自动进行CRC的数据校验,以保证数据的完整性。在进行数据恢复时,用户需要经过三重的安全验证,只有验证通过,才能进行数据的恢复。所以ITSM的备份数据的安全性可以得到有效的保障。
ITSM 在磁带中的保存格式是ITSM独有的格式,只有通过ITSM数据库的配合,在ITSM系统内部才可以将备份数据读出。而且,在每次进行数据备份时, ITSM 会检查介质的可用性,如果遇到错带,它会拒绝使用,防止数据备份的失败。 ITSM 系统会在备份是在每合磁带的带头写入一些ITSM的控制信息,当进行数据恢复时,系统会自动进行这些信息的校验,如果信息校验失败(如插入错误的备份磁带),系统会拒绝使用,这可以有效的保证备份数据的完整性
对于Oracle应用的在线热备份,ITSM通过ITSM应用支持模块在应用系统所在的机器执行,也可以通过ITSM的定时机制实现集中的存储管理。在定时机制执行时,并不须依赖系统的ROOT权限,可以直接通过ITSM的内部安全机制实现。
ITSM 对它的数据库和日志提供多达三份镜像(Mirror)保护,以防止单一备份失效和系统崩溃后给整个系统带来的灾难性破坏。
ITSM 对其后台数据库和LOG文件可以进行备份和快速恢复。由于ITSM的后台数据库是一个关系数据库(在文件系统中以一个加密的文件的形式存在),所有的系统数据都保存在数据表中,可以有效的防止由于系统数据的分散(包括物理的分散和逻辑的分散)造成的单点故障,并且可以对其后台数据库和LOG文件提供多达三种的数据备份方式:全备份、增量备份、SNAPSHOT(只备份LOG),这样可以减轻系统管理人员的负担,而且,通过对LOG的备份,ITSM自身可以实现定点的恢复。
ITSM 提供对IBM HACMP/CLUSTER的支持,当一个节点HACMP/CLUSTER的出现故障,HACMP/CLUSTER切换节点后,ITSM继续其数据备份的工作,并且保证数据的一致性。
对于复杂环境下的数据备份,可能会同时有多台客户机同时提出备份的请求,这样存储服务器的负担将非常的大。ITSM提供了 Web Proxy Server (ITSM代理服务器,可以安装在另外的机器上)的功能,对这些请求按优先级进行自动的队列,这大大的减轻了ITSM服务器的负担,提供了更好的可操作性和扩展性,由于Web Proxy Server与ITSM服务器和ITSM客户机的通讯采用加密机制(SSL),这也提高了整个ITSM系统的可靠性和安全性。
 
ITSM 备份管理可以将磁带有效的管理起来并建立电子标签;即使人工标签脱落导致发生混乱,也可以通过电子标签快速查询介质上数据的内容。ITSM能够自动跟踪所有介质的去向和使用情况。ITSM不仅自动管理磁带库、光盘库中的介质,还能跟踪放在磁带库、光盘库外的介质和保留在异地的备份介质。
ITSM 在介质管理中采用了独一无二的“磁带集中”和“磁带重用”技术。“磁带集中”使每个客户机的每天的备份数据都对应放在一盒或一组磁带上,使得ITSM能够用最少的磁带数做恢复。这是一种迅速、可靠的数据恢复方式。
“ 磁带重用”的目的是使磁带库或光盘库介质自动轮转,完全实现备份、恢复的无人值守。原理是:当介质上的过期数据越来越多并达到一定限度时,比如介质上80%的数据都过期了,ITSM会自动把数个这样的介质的残余数据整合到一个介质中,而其它介质重新进入新的介质轮转中去。所以,如果用户有足够的存储容量,ITSM可以做到真正的‘零管理’。
在进行对备份数据存储时,ITSM通过在不同的存储设备中建立不同的存储池来实现数据的分层存储和迁移,对于一些大文件,ITSM可以指定直接存放在磁带上,这样可以减少对主机IO资源的消耗,也能提高备份的效率;对于一些小文件,可以先将小文件暂时存放在硬盘的存储池上,进行数据的重整,当这些文件达到一定百分比时(由系统管理员设定),再一次性的存放在磁带上,这样可以大大减少磁带的MOUNT带和就位时间,提高了数据的备份效率,数据的存放也更科学合理。
 
ITSM 的灾难管理功能(简称DRM)能够指导用户如何操作来迅速恢复用户范围内的各种数据。
自动、准确的DRM功能帮助用户保护宝贵数据的安全性。在ITSM管辖内的数据,都能通过DRM自动策划、准备及制作备份恢复计划,一旦DRM生成了计划文件,所有服务器上最新的相关信息都被收集起来,以备恢复。
如果灾难发生,DRM提供恢复步骤的详细文档,可执行的描述文件自动恢复数据、重建环境。DRM使得用户可以很快回复正常运转。
DRM 智能化管理和跟踪备份介质的转移。帮助管理员决定哪些介质本地保存,哪些介质需要异地保存。当恢复灾难时,DRM帮助用户迅速找到所有需要的介质,无论这些介质是在本地或运输途中或在异地的保险柜里。
ITSM 客户端追踪管理功能帮助系统管理员了解哪些系统被灾害摧毁,以及这些机器所需要的软硬件,以便用户决定需要重新定购哪些设备来替换损坏的设备。其他DRM记录的重要信息包括:需要恢复的各台机器的优先级;相关人员的连续方式等。
同时,对于异地数据保管和恢复,ITSM 提供了一个独特功能:Instant Archive and Rapid Recovery 。这个功能是在ITSM server 上将所需要恢复的数据影像到其它的可移动存储介质中,如普通8mm tape 、可写CD 等。管理人员再将这些存储介质拿到需要恢复的设备上,利用ITSM Client 的功能将这些数据恢复到系统中即可。 这个功能即可以帮助客户将最为重要的数据复制到CD或磁带中永久归档保存;又可以在网络出现故障时,作为解决远程恢复问题的辅助手段。Instant Archive and Rapid Recovery 在功能上类似于UNIX 的系统备份。这种脱机恢复方式可以允许系统恢复到任意符合要求的设备上,为分析、开发、灾备提供了更大的灵活性。
 
ITSM 内置了Tivoli Decision Support for Tivoli Storage Manager,它收集ITSM每次执行任务的情况,包括状态、性能等,然后给出详细的分析资料和变化趋势。针对存储管理的特点,给出量化的指标。而且,Tivoli Decision Support还支持通过Internet定时进行分析数据的发布,从而为一个集中的管理要求提供了技术上的可能。
 
ITSM 独具的 Adaptive sub-file backup,可以根据备份文件的大小、传输线路的质量的情况来动态决定传输数据的方式,从几个bits、或bytes、或blocks到文件级别,而不是以前的文件级的备份和恢复。这种技术支持多种的连通方式,包括LANs、WANs、Internets和拨号线路,这种技术专门为移动用户或是需要在网上尽可能少地的传输量的客户而设计。而且这种技术提供了传递的加密和压缩机制,用户可以选择是否需要进行加密,从而可以在公用线路上备份/恢复关键数据,保证了数据传递的安全性和对带宽的占用。这为客户今后开展移动办公提供了技术储备,保护了客户在存储管理软件上的投资。
 
ITSM是唯一采用关系数据库作为核心的存储管理软件。由于关系数据库的标准性和开放性,用户可以非常方便利用标准 SQL语句进行二次开发,包括定制索引、备份数据的快速查询等功能,都可以通过标准的SQL语句来实现。同时,SQL语句的应用,大大扩展了ITSM的管理功能和监控功能,结合ITSM开放的API,可以实现用户对存储管理的高要求,也提升了ITSM的灵活性。
ITSM可以提供命令行的管理方式,在此种管理方式下,可以利用 ITSM的管理命令对客户存储环境进行管理。而且,所有的ITSM内部命令包括基本的备份和恢复命令、对磁带库的管理命令等都可以在操作系统级执行,结合操作系统的一些管理功能,用户可以定制自己的存储管理的SCRIPT,此SCRIPT的执行,可以通过操作系统直接执行,也可以通过ITSM提供开放的COMMAND SCRIPT功能利用ITSM来执行。
因此,通过以上的开放功能,用户可以非常方便的对 ITSM进行二次开发,满足客户对存储管理的特定要求。
 
作为一家专业而全面的系统管理解决方案提供商,Tivoli的软件覆盖了系统管理(包括硬件、操作系统、网络、应用的监控和管理)、安全管理、存储管理等范围,而且,Tivoli所有的产品都可以良好的集成在一起,通过一个统一的界面就可以实现系统管理的所有功能。在系统管理的基础上,Tivoli同时还提供了基于业务管理模式的统一控制台,决策和多维数据分析工具等,这些增值的功能可以大大提高用户的服务水平,增强用户的竞争力。因此,IBM建议, 用户可以 从存储管理着手,在保证应用数据可靠性的基础上,通过软硬件的综合扩展,采用统一的系统管理支撑平台,可以逐渐建立起一套全面的高度集中的高效率的系统管理机制,包括应用系统的管理、网络管理、安全管理、存储管理等各方面,以满足用户发展的需求,通过成熟的IT管理架构,最大限度的提高用户的管理水平和服务水平,减少成本,最大限度的满足目标客户的需求。
ITSM 可以通过 Tivoli Plus Module 和 Tivoli 的其他产品无缝集成,包括 Tivoli 的系统监控、事件分析处理工具、网管、安全模块等,从而构成一个完整的系统管理解决方案。
ITSM 系统可以根据客户的需求平滑的升级到灾难恢复系统,实现应用级的数据复制。而且,这种灾难恢复系统更适合国内的情况,依据如下:
目前,国内的硬件和网络环境还不是很理想,很多的用户目前在数据管理、数据保护方面也没有完全考虑周全,因此,在目前的条件下,应当首先考虑数据和应用的第一层保护,即关键数据及应用的存储管理,然后,在此基础上进行数据及关键应用保护的扩展,建立合理的灾难备份恢复系统。
事实上,利用存储管理软件作为灾难恢复系统的基石,构建灾难恢复系统,相对于其他的灾难备份系统,存储管理软件作为灾难备份恢复系统,具有以下独特的优势:
☆  成本低,通过存储管理实现灾难恢复,可以充分利用用户现有的存储设备,减少了用户在设备上的投资。
☆  风险低,由于这种灾难恢复系统可以分步实施,每一步都有明确的目标,对于客户来说,这都是可控的。
☆  操作简单,对技术人员要求低,许多的步骤都可以自动执行,即使遇到意外的特殊情况,由于系统操作人员一般都熟悉存储管理软件的基本操作和原理,可以第一时间得到及时的处理。
Tivoli Storage Manager 相对其他别的存储管理工具,由于得益于IBM 和Tivoli 对数据存储管理、灾难恢复的高度重视和成熟技术,在灾难恢复系统的利用和建立上更是领先一大步:
☆ 拥有成功的灾难恢复模块,专门从事系统的重建工作。
☆ 拥有成熟的技术服务队伍,从事备份和灾难恢复系统的顾问和规划以及实施工作。
☆ 拥有多层次的技术支援体系,提供从开发人员、实验室到技术支持工程师等一系列的技术支援,及时解决客户问题。
☆ 最关键的是,ITSM 作为灾难恢复和业务接管系统在国内已经在某些客户作过成功的测试,并得到一致的认可。
☆ ITSM 作为灾难恢复系统,不需对生产系统机器进行任何的改动,并可在客户生产应用系统运行的前提下立即在线安装、配置,一旦配置成功,系统将按照事先定义的策略进行数据的自动保护。
☆ ITSM 在数据存储管理时,对生产机器和备份机器的资源占用将比较小。根据内部和客户的测试结果,ITSM 在备份和恢复数据时,极端情况下,占用的系统资源都不会超过20% 。
☆ 在数据的传递过程中,数据一直都通过ITSM 的后台数据库进行校验,保证了数据通过网络传输的一致性。