1、备份的简介
指将文件系统或数据库系统中的数据加以复制(保存数据);一旦发生灾难或错误操作时,得以方便而及时地恢复系统的有效数据和正常运作;
备份目的是为了恢复,备份是容灾的基础。
在一套备份系统中,通常包括以下组件:
- 备份服务器:备份服务器是运行备份软件的载体,一般是PC服务器和小型机。
- 备份软件:备份系统的核心,备份软件控制生产数据拷贝到存储介质上,并对备份数据进行管理,如Symantec的Backup Exec和NetBackup等。
- 存储设备:备份数据存储的设备,一般为磁盘阵列、物理磁带库或者虚拟带库。
2、备份系统的组成
- 备份服务器:维护所有的配置信息(客户端,介质代理,备份设备等),管理所有的作业和历史任务记录,提供GUI/WEB等管理界面;
- 介质服务器:负责管理数据在物理存储设备和它对应的客户端代理之间传输数据。
2.1、备份介质:
- 磁盘阵列:适用于数据量大,备份窗口相对较小,对备份设备的性能和可靠性要求很高的场合,如数据中心。产品如华为OceanStor V3系列、18000系列等。
- 磁带库:适用于备份数据量不大,时间窗口宽裕,或希望将数据异地离线长期保存的场景。如HPMSL6060、IBM TS3310?等。
- 虚拟带库:需继承企业原有磁带备份架构和策略,又需提高备份速度的场景,如华为VTL6900。(VTL:Virtual Tape library虚拟磁带库。可以融入到现有磁带备份环境中,和磁带产品配合使用,构成一个集磁带和磁盘两种技术优势的解决方案
- 盘塔、光盘库:适用于对速度要求不高,容量不大,不用经常擦写的场景,如教育、档案、图书馆、广电等行业,如SONYPDJ-1080。
- 云存储:适合备份数据量不是很大的业务,如OceanStor 9000 、 FusionStorage
- 一体机:就是将主服务器,介质服务器,备份介质集成到一个物理设备上。
2.2、备份网络
- 备份数据流由备份客户端到备份服务器的传输路径;
- 一般是TCP/IP网络或fc光纤通道;
2.3、备份客户端:
- 需要备份的业务主机一般需要安装备份软件客户端代理程序(Agent);
2.4、备份管理系统
- 含备份管理软件和备份管理服务器;
- 自动发起备份作业,执行备份,读取备份客户端的数据,并把数据写入到备份介质中。
3、备份系统三要素
- BW(Backup Window):一个工作周期内留给备份系统进行备份的时间长度;
- RPO (Recovery Point Objective):可以承受的最大数据丢失量;
- RTO (Recovery Time Objective):可以承受的最长停机时间;
4、典型备份类型
概念 | 优点 | 缺点 |
完全备份(每天全备份) | 能够基于上一次的完全备份快速恢复数据,恢复窗口小; | 所占用的存储空间大,每次备份耗时长,备份窗口大; |
累积增量式备份:每周一次全备份,本周其余每天备份与上次备份的差异部分 | 相对完全备份来说每次备份可以节约一个完全备份的存储空间,备 份窗口较小,恢复窗口较小; | 恢复时必须依赖上一次完全备份和本次的累积增量式备份才能完整恢复数据,恢复时间较差异增量式备份较短; |
差异增量式备份:每周一次全备份,本周其余每天备份与全备份的差异部分 | 能够最大限度地节省存储空间,备份窗口小; | 数据恢复时必须依赖上一次完全备份和每一次的差异增量式备份才能对数据进行完整恢复,恢复时数据重构较慢,恢复时间较长; |
5、本地集中备份
场景:本地DC集中备份、运营商、企业等;
支持的平台:①支持Windows, Linux和UNIX平台的文件和应用备份;
②支持VMware, Hyper-V, FusionCompute虚拟化平台备份;
方案亮点:①支持并行重删,节约备份存储空间;
②支持调用华为阵列的硬件快照进行数据备份,业务零影响,秒级恢复;
③全图形化GUI统一管理,无需编写任何脚本,操作维护简单;
6、一体化备份
场景:SMB、分支机构小数据量的本地备份;
支持的平台:①支持Windows, Linux和UNIX平台的文件和应用备份;
②支持VMware, Hyper-V, FusionCompute虚拟化平台备份;
方案亮点:①备份服务器、备份存储一体化,设备和维护费用减少50%;
②全图形化GUI统一管理,无需编写任何脚本,操作维护简单;
7、本地和远程集中备份
场景:本地DC集中备份、运营商、企业等、远程备份;
支持的平台:①支持Windows, Linux和UNIX平台的文件和应用备份;
②支持VMware, Hyper-V, FusionCompute虚拟化平台备份;
方案亮点:(同本地集中备份亮点)
8、典型备份网络
- LAN-Base:备份数据流通过现有LAN网络进行传输;
优点:①充分利用现有网络,节省投资;②对设备的要求较低;
缺点:①占用现有网络带宽;②备份性能受限;③对主机应用有一定影响;
- LAN-Free:备份数据流通过SAN网络进行传输;
优点:①对现有业务网络影响小;②备份性能好;
缺点:①对网络的投资较大;②对设备的要求较高;
- Server-Free:备份数据流不经过生产服务器,而是通过独立网络进行传输。
优点:①对业务主机几乎无影响;②对现有业务网络几乎无影响;③备份性能好;
缺点:①对网络的投资较大;②对设备的要求较高
9、统一管理
集中管理的对象包括企业的主服务器、所有介质代理、存储设备和客户端代理。
统一管理的内容包括:
统一性能管理,如:历史性能统计,性能数据导出等。
统一监控管理,如:系统状态实时监控,资源业务状态查询等。
统一设备管理,如:物理设备管理,简单的配置向导等。
统一资源管理,如:统一存储资源管理,物理磁盘和共享存储空间的统一管理等。
对备份的价值:能更有效的节省存储的空间,大大提高存储的利用率,降低用户的TCO。
10、重删技术分类
重删技术可以按照重删的位置、时刻、粒度、范围等多个维度进行分类。
源端重删:先删除重复数据,再将数据传到备份设备。
目标端重删:先将数据传到备份设备,存储时再删除重复数据。
后处理方式(Post-Processing):先把数据块存储在缓存中,等系统空闲时再进行去重处理。优点是不影响数据传输性能,缺点是需要额外的存储空间。
在线重删(Inline):数据写入磁盘之前进行重复数据删除。
后处理重删(Post-processing):数据写入磁盘后开始进行重复数据删除。
适应性重删(Adaptative Data Deduplication):性能要求较低的环境下采用在线重删,性能要求较高的时候采用后处理重删。
本地重删:查找重复数据时,仅和当前存储设备内的数据进行比较
全局重删:查找重复数据时,和整个重删域中的所有存储设备的数据进行比较。
块级重删:将文件/对象分解成固定长度或不定长度的数据块,对数据块进行哈希计算,并与已存块的哈希值进行比较,只存储唯一哈希的数据块。
字节级重删:从字节层次查找和删除重复的内容,一般是通过压缩算法对用户数据进行压缩存储。
件级重删:也称为单实例存储(SIS),根据索引检查需要存储文件的属性,并与已存储文件进行比较如果没有相同文件,就将其存储,并更新索引;否则仅存入指向已存在文件的指针。
11、备份再次介绍
备份服务器的HA:两个备份服务器能够以HA模式部署,提高可靠性;
介质代理的多路径:所有介质代理以A-A模式工作并具有多路径支持,用于负载均衡和切换;
双控制器:存储设备的双控制器使存储装置更稳定、更可靠;
备份客户端会通过服务器切换来自动切换到集群中的另一服务器;
自动切换、快速开关、维护工作少、易扩展、集中管理、高灵活性、大规模;
在单个域中管理整个企业数据保护,具有良好的向外扩展能力。介质代理维护颗粒索引信息,以支持数百万对象。