备份基础知识(一)

备份基础知识(一)

1、备份,容灾,复制,双活的区别 ,适用场景
存储级的双活:RPO=0,RTO=0。兼顾业务持续能力和投资效率。平时两个站点同时运行,可以负载均衡。而当一个站点遭受大范围的数据丢失(如停电、火灾等),另一个站点仍然可以工作。但由于两个站点间的距离不能太远,所以无法抵御地震、洪水等自然灾害。更无法抵御人为的破坏。

远程复制:RPO较小,但大于0。一般为异步复制,所以RPO和RTO无法为0. 但可以跨越很长距离,所以可以抵御地震、洪水等自然灾害。

备份:RPO和RTO都比较大,一般在小时的级别。但备份软件可以保存数据修改的版本,所以可以抵御软件错误和人为破坏:比如文件被删除了,还可以从旧版本中恢复出来。备份软件一般会通过(操作系统级和数据库级)快照功能确保数据一致性。
(1)容灾和备份的目的不同
容灾系统的目的在于保证系统数据和服务的“在线性”,即当系统发生故障时,仍然能够正常地向网络系统提供数据和服务,以使系统不致停顿。
而备份技术的目的与此并不相同,备份是“将在线数据转移成离线数据的过程”,其目的在于应付系统数据中的逻辑错误和历史数据保存。
(2)备份是基石
备份是指为防止系统出现操作失误或系统故障导致数据丢失,而将全系统或部分数据集合从应用主机的硬盘或阵列复制到其它的存储介质的过程。备份是数据高可用的最后一道防线,其目的是为了系统数据崩溃时能够恢复数据。
(3)容灾不可少
那么建设了备份系统,是否就不需要容灾系统?这还要看业务部门对RTO(恢复所需时间指标)/RPO(能够恢复到的最新状态)指标的期望值,如果允许 1TB的数据库RTO=8小时,RPO=1天,那备份系统就能满足要求。同时,备份的目的在于应付系统数据中的逻辑错误和历史数据保存。只能够满足数据丢失、数据破坏时的数据恢复目的,而不能提供实时的业务接管功能。
因此容灾系统对于某些关键业务而言也是必不可少的。人们谈及容灾往往是针对当生产系统不能正常工作时,其业务可由容灾系统接替这些业务,继续进行正常的工 作。能够提供很好的RTO和RPO指标。同时远程容灾系统具备应付各种灾难,特别是区域性与毁灭性灾难的能力,具备较为完善的数据保护与灾难恢复功能,保 证灾难降临时数据的完整性及业务的连续性,并在最短时间内恢复业务系统的正常运行,将损失降到最小。
(4)容灾不能替换备份
容灾系统会完整地把生产系统的任何变化复制到容灾端去,包括不想让它复制的工作,比如不小心把计费系统内的用户信息表删除了,同时容灾端的用户信息表也会被 完整地删除。如果是同步容灾,那容灾端同时就删除了;如果是异步容灾,那容灾端在数据异步复制的间隔内就会被删除。这时就需要从备份系统中取出最新备份, 来恢复被错误删除的信息。因此容灾系统的建设不能替代备份系统的建设。

2、备份窗口,RTO,RPO,数据保留周期,副本
(1)备份窗口
定义:在用户正常使用的业务系统不受影响的情况下,能够对业务系统中的业务数据进行数据备份的时间间隔,或者说是用于备份的时间段。备份窗口根据操作特性来设定。
例如,如果数据从早上8点到午夜被使用,则可用于备份时间就为午夜到早上8点(备份窗口)。为了保证备份数据的一致性,在备份过程中数据不能被更改。所以在某些情况下,备份窗口是数据和应用不可用的间隔时间。
离线备份需要保证应用程序在备份过程中不会更新数据。在线备份一般使用即时技术来构造原始数据的一致性像。
如果备份除了应用程序外,还使用到不同的资源(存储设备、I/O路径和处理资源),例如在分享镜像即时拷贝中,那么备份窗口就是创建镜像所需要的时间。
如果在线备份与使用备份数据的应用程序共享资源,例如在写时拷贝的即时中,那么备份窗口可能会因为资源竞争而增加。
(2)RPO,RTO
RPO可简单地描述为企业能容忍的最大数据丢失量。
RTO可简单地描述为企业能容忍的恢复时间。
(3)数据保留周期:对备份的数据保留时间的设定,具体看备份数据的重要性。
rman target /
修改RMAN的备份保留周期
configure retention policy to recovery window of 1 days;
列出超过保留时间的备份;
report obsolete;
删除超过保留时间的备份;
delete obsolete;
(4)副本
副本:在电子文档编辑中对文档内容的复制,作为对原文本内容的备份。实质为电子文档的复制品
副本备份:复制所有选中的文件,但不将这些文件标记为已经备份。如果要在普通备份和增量备份之间备份文件,复制将非常有用,因为复制不影响这些其他的备份操作。

3、定时备份,实时备份,事件触发备份
数据备份时间策略按照触发数据备份操作的类型可分为:实时备份、定时备份、事件触发三类。每种数据备份时间策略适用的不同应用环境。
(1)实时备份
实时备份也可以称为实时复制,通常在块设备层和传输层实现。通过获取存储设备发生的数据变化,并将数据变化传输、存储到另外的存储设备实现实时复制。
实时复制又可分为同步复制和异步复制。另外,连续数据保护也是实时备份的一个分支。
(2) 定时备份
定时备份指在某个时间点触发。如每天03:13:23、每周一的13:10:09、每月3日的21:10:09等。定时备份通常在系统负载较轻时有备份系统自动触发,并在一个备份周期内执行完。
定时备份广泛应用于文件备份、数据库备份、操作系统备份、虚拟机备份、应用系统备份等各种应用场景。
(3) 事件触发
事件触发备份指当某一个确定事件发生时,触发备份操作。相对实时备份和定时备份来说,在教科书中见得较少,但实际有广泛的应用。以下例子可称为事件触发:
1)立即备份/手动备份,由管理员触发的备份操作,该操作立即执行。
2)文件/目录发生变化时,当文件内容改变、目录中增加、减少、移动等变化被感知后,触发备份操作。
3)滚动备份,指上次备份完成后,间隔一小段时间后开始下一次备份,曾有厂商在用户现场将时间间隔设置为0,并讲解此策略类似实时备份,请大家擦亮眼睛。
4)关闭应用程序前备份,指在正常退出应用程序前,触发备份操作,此策略在很多小微企业使用的财务软件、进销存软件中应用,效果不错。

4、物理备份,逻辑备份
物理备份: 物理备份是磁盘块为基本单位将数据从主机复制到备机。
逻辑备份: 逻辑备份是以文件为基本单位将数据从主机复制到备机。
接着我们就备份的高效性,实时性和支持度来分别来详细谈谈这两种备份模式的区别:
(1)高效性
物理备份是位于文件系统之下和硬件磁盘驱动之上。增加了一个软驱动,它忽略了文件和结构,处理过程简洁,因此在执行过程中所花费在搜索操作上的开销较少,备份的性能很高。
逻辑备份是基于文件级别的备份,由于每个文件都是由不同的逻辑块组成。每一个逻辑的文件块存储在连续的物理磁盘块上,但组成一个文件的不同逻辑块极有可能存储在分散的磁盘块上。逻辑备份在对非连续存储磁盘上的文件进行备份时需要额外的查找操作。这些额外的操作增加了磁盘的开销,降低了磁盘的吞吐率。所以,跟物理备份相比较,备份性能较差。
物理备份避免了当文件出现一个小的改动的时候,就需要对整个文件做备份,只是会去做改动部分的备份,有效的提高了备份效率,节省了备份时间。
逻辑备份模式下,文件即使一个很小的改变,也需将整个文件备份。这样如果一个文件很大的情况下,就会大幅度的降低备份效率,增加磁盘开销和备份时间。
(2)实时性
物理备份可以做到高效的实时备份,因为在每次主机往磁盘写数据的时候,都需要同时将数据写入到备机,这种写入操作都是基于磁盘扇区的,所以,很快就能被识别。只有在备机完成之后,才会返回给上层的应用系统来继续下一步工作。
逻辑备份是很难做到实时备份的,因为它的每次修改都是基于文件的,而文件的哪部分被修改,系统很难实时捕获到,所以备份的时候需要把整个文件读一遍再发到备机 ,实时的效率不是很高。
(3)支持度
物理备份是在文件系统之下对数据进行复制,所以它不受文件系统限制,可以支持各种文件系统包括RAW分区。
逻辑备份是以单个文件为单位对数据进行复制,所以它受文件系统限制,仅能对部分支持的文件系统做备份,不支持RAW分区。

逻辑备份和物理备份各有优劣,一般来说,物理备份恢复速度比较快,占用空间比较大,逻辑备份速度比较慢,占用空间比较小。逻辑备份的恢复成本高。
逻辑备份
逻辑备份是备份sql语句,在恢复的时候执行备份的sql语句实现数据库数据的重现。
1)mysqldump
mysqldump是采用SQL级别的备份机制,他将数据表导成SQL脚本文件,是最常用的逻辑备份方法。
优点:
1、恢复简单,可以使用管道将他们输入到mysql
2、与存储引擎无关,因为是从MySQL服务器中提取数据而生成的,所以消除了底层数据存储的不同
3、有助于避免数据损坏。若磁盘驱动器有故障而要复制原始文件时,此时将得到一个损坏的备份
缺点:
1、 必须有数据库服务器完成逻辑工作,需要更多地cpu周期
2、 逻辑备份还原速度慢:需要MySQL加载和解释语句、转化存储格式、重建引擎
物理备份
物理备份就是备份数据文件了,比较形象点就是cp下数据文件,但真正备份的时候自然不是的cp这么简单。
1)使用 xtrabackup 工具
是一个用来备份 MySQL数据库的开源工具。
优点:
1、 基于文件的物理备份
2、 容易跨平台、跨操作系统和MySQL版本
3、 恢复起来会更快(不需要执行任何的mysql语句,不需要构建索引,innoDB表无需完全缓存到内存)
缺点:
1、 文件大
2、 不总是可以跨平台、操作系统和MySQL版本
主要特点:
<1>. 在线热备份。可以备份innodb和myisam。innodb主要应用recovery原理。myisam直接拷贝文件。
<2>. 支持流备份。可以备份到disk,tape和reomot host。–stream=tar ./ | ssh user@remotehost cat “>” /backup/dir/
<3>. 支持增量备份。可以利用lsn和基础备份目录来进行增量备份。
<4>. 支持记录slave上的master log和master position信息。
<5>. 支持多个进程同时热备份,xtrabackup的稳定性还是挺好的。
2)LVM
特点:热备、支持所有基于本地磁盘的存储引擎、快速备份、低开销、容易保持完整性、快速恢复等。
3)cp + tar
使用直接拷贝数据库文件的方式进行打包备份,需要注意的是执行步骤:锁表、备份、解表。
恢复也很简单,直接拷贝到之前的数据库文件的存放目录即可。
注意:对于Innodb引擎的表来说,还需要备份日志文件,即ib_logfile*文件。因为当Innodb表损坏时,就可以依靠这些日志文件来恢复。
4)mysqlhotcopy
mysqlhotcopy是一个perl程序,是lock tables、flush tables 和cp或scp来快速备份数据库。
它是备份数据库或单个表的最快的途径,但它只能运行在数据库文件(包括数据表文件、数据文件、索引文件)所在的机器上。
mysqlhotcopy只能用于备份MyISAM。
5)使用mysql主从复制
mysql的复制是指将主数据库的DDL和DML操作通过二进制文件(bin-log)传送到从服务器上,然后在从服务器上对这些日志做重新执行的操作,从而使得从服务器和主服务器保持数据的同步。

5、热备份,冷备份
(1)热备份
  热备份是在数据库运行的情况下,采用archivelog mode方式备份数据库的方法。所以,假如你有昨天夜里的一个冷备份而且又有今天的热备份文件,在发生问题时,就可以利用这些资料恢复更多的信息。热备份要求数据库在Archivelog方式下操作,并需要大量的档案空间。一旦数据库运行在archivelog状态下,就可以做备份了。
  热备份的命令文件由三部分组成:
  1、数据文件一个表空间一个表空间的备份
  (1)设置表空间为备份状态
  (2)备份表空间的数据文件
  (3)回复表空间为正常状态
  2、备份归档log文件
  (1)临时停止归档进程
  (2)log下那些在archive rede log目标目录中的文件
  (3)重新启动archive进程
  (4)备份归档的redo log文件
3、用alter database bachup controlfile命令来备份控制文件
热备份的优点是:
  (1)可在表空间或数据库文件级备份,备份的时间短。
  (2)备份时数据库仍可使用。
  (3)可达到秒级恢复(恢复到某一时间点上)。
  (4)可对几乎所有数据库实体做恢复
  (5)恢复是快速的,在大多数情况下该数据库仍工作时恢复。
  热备份的不足是:
   1、不能出错,否则后果严重
   2、若热备份不成功,所得结果不可用于时间点的恢复
   3、因难于维护,所以要非常仔细小心,不答应“以失败告终”。
(2)冷备份
  冷备份发生在数据库已经正常关闭的情况下,当正常关闭时会提供给我们一个完整的数据库。冷备份时将要害性文件拷贝到另外的位置的一种说法。对于备份Oracle信息而言,冷备份时最快和最安全的方法。
  冷备份的优点是:
  1、是非常快速的备份方法(只需拷文件)
  2、轻易归档(简单拷贝即可)
  3、轻易恢复到某个时间点上(只需将文件再拷贝回去)
  4、能与归档方法相结合,做数据库“最佳状态”的恢复。
  5、低度维护,高度安全。
  冷备份也有如下不足:
  1、单独使用时,只能提供到“某一时间点上”的恢复。
  2、再实施备份的全过程中,数据库必须要作备份而不能作其他工作。也就是说,在冷备份过程中,数据库必须是关闭状态。
  3、若磁盘空间有限,只能拷贝到磁带等其他外部存储设备上,速度会很慢。
  4、不能按表或按用户恢复。
  假如可能的话(主要看效率),应将信息备份到磁盘上,然后启动数据库(使用户可以工作)并将备份的信息拷贝到磁带上(拷贝的同时,数据库也可以工作)。
  冷备份中必须拷贝的文件包括:
  1、所有数据文件
  2、所有控制文件
  3、所有联机REDO LOG文件
  4、Init.ora文件(可选)
  值得注重的使冷备份必须在数据库关闭的情况下进行,当数据库处于打开状态时,执行数据库文件系统备份是无效的。
  下面是作冷备份的完整例子。
  (1)关闭数据库
  sqlplus /nolog
  sql > connect /as sysdba
  sql > shutdown normal;
  (2)用拷贝命令备份全部的时间文件、重做日志文件、控制文件、初始化参数文件
  sql > cp
  (3)重启Oracle数据库
  sql > startup

6、完全备份,增量备份,差异备份
“存档”属性表示此文件、文件夹的备份属性,只是提供给备份程序使用,当未选中时,备份程序就会认为此文件已经“备份过”,可以不用再备份了。所以,当备份程序备份了一个文件时,默认是未选中“存档”属性。
换句话说备份软件把已经备份过的文件的存档属性去掉,表示已经备份。 如果对该文件进行修改,会重新添加存档属性。下次启动备份软件,检查存档属性,没有的就是上次备份以来没改变的,有的就是上次备份以来由改变的,这样就可以实现“增量备份”只备份变化了的数据。
在这里插入图片描述
(1)完全备份
备份全部选中的文件夹,并不依赖文件的存档属性来确定备份那些文件。
(在备份过程中,任何现有的标记都被清除,每个文件都被标记为已备份,换言之,清除存档属性)。
完全备份就是指对某一个时间点上的所有数据或应用进行的一个完全拷贝。实际应用中就是用一盘磁带对整个系统进行完全备份,包括其中的系统和所有数据。这种备份方式最大的好处就是只要用一盘磁带,就可以恢复丢失的数据。因此大大加快了系统或数据的恢复时间,然而它的不足之处在于,各个全备份磁带中的备份数据存在大量的重复信息;另外,由于每次需要备份的数据量相当大,因此备份所需时间较长。
(2)差异备份
差异备份是针对完全备份:备份上一次的完全备份后发生变化的所有文件。
(差异备份过程中,只备份有标记的那些选中的文件和文件夹。它不清除标记,既:备份后不标记为已备份文件,换言之,不清除存档属性)。
差异备份是指在一次全备份后到进行差异备份的这段时间内,对那些增加或者修改文件的备份。在进行恢复时,我们只需对第一次全备份和最后一次差异备份进行恢复。
举例来说,在星期一,网络管理员按惯例进行系统完全备份;
在星期二,假设系统内只多了一个资产清单,于是管理员只需将这份资产清单一并备份下来即可;
在星期三,系统内又多了一份产品目录,于是管理员不仅要将这份目录,还要连同星期二的那份资产清单一并备份下来。
如果在星期四系统内有多了一张工资表,那么星期四需要备份的内容就是:工资表+产品目录+资产清单。
差异备份在避免了另外两种备份策略缺陷的同时,又具备了它们各自的优点。
首先,它具有了增量备份需要时间短、节省磁盘空间的优势;
其次,它又具有了全备份恢复所需磁带少、恢复时间短的特点。系统管理员只需要两盘磁带,即全备份磁带与灾难发生前一天的差异备份磁带,就可以将系统恢复。
(3)增量备份
增量备份是针对于上一次备份(无论是哪种备份):备份上一次备份后,所有发生变化的文件。
(增量备份过程中,只备份有标记的选中的文件和文件夹,它清除标记,既:备份后标记文件,换言之,清除存档属性。)
增量备份是指在一次全备份或上一次增量备份后,以后每次的备份只需备份与前一次相比增加和者被修改的文件。这就意味着,第一次增量备份的对象是进行全备后所产生的增加和修改的文件;第二次增量备份的对象是进行第一次增量备份后所产生的增加和修改的文件,如此类推。
这种备份方式最显著的优点就是:没有重复的备份数据,因此备份的数据量不大,备份所需的时间很短。
但增量备份的数据恢复是比较麻烦的。您必须具有上一次全备份和所有增量备份磁带(一旦丢失或损坏其中的一盘磁带,就会造成恢复的失败),并且它们必须沿着从全备份到依次增量备份的时间顺序逐个反推恢复,因此这就极大地延长了恢复时间。 可靠性也比较差。
(4)不同备份类型组合应用的示例
<1>完全备份与差异备份结合(建议使用)
以每周数据备份计划为例,我们可以在星期一进行完全备份,在星期二至星期五进行差异备份。
如果在星期五数据被破坏了,则你只需要还原星期一完全的备份和星期四的差异备份。
这种策略备份数据需要较多的时间,但还原数据使用较少的时间。
<2>完全备份与增量备份结合
以每周数据备份为例,在星期一进行完全备份,在星期二至星期五进行增量备份。
如果在星期五数据被破坏了,则你需要还原星期一正常的备份和从星期二至星期五的所有增量备份。
这种策略备份数据需要较少的时间,但还原数据使用较多的时间。

7、有代理备份 无代理备份
http://www.sohu.com/a/225458215_99939283
<1>无代理备份,无需在主机上部署代理软件就可实现服务器备份。它直接从存储(或虚拟机)进行备份。无代理备份不是真正的无代理,它只需要在一台选定的计算机上安装一个备份代理进行网络范围的备份。
相比虚拟化,在物理环境实现无代理备份困难很多,不同应用的支持和兼容性也比较差。不像虚拟化环境,标准接口可以把需要备份的业务连同虚拟机当作文件看待,通过类似快照或数据块变化跟踪技术备份即可,备份操作根本不需要关注虚拟机里面运行的具体是什么业务。
优点:
1 、降低成本
2、简化数据备份的业务流程
3 、 简化管理
每个主机没有软件需要维护。这减少了管理和兼容性的负担,特别是在虚拟机(VM)转换的环境中。在管理中有很大的开销,以确保备份代理始终保持***状态,因为在许多情况下,代理软件版本取决于备份软件和主机操作系统版本。
4 、 应用程序一致性
无代理程序备份支持快照技术,该技术可在特定时间点生成虚拟化服务器或虚拟机的完整副本。恢复快照的功能允许应用程序继续运行而不会丢失数据,从而确保应用程序的一致性,这对业务连续性至关重要。快照数据不会进行存储压缩,因此可以非常快速地进行恢复。
缺点:
1 、需要完全虚拟化的环境:在具有物理和虚拟化服务器的网络中,管理员只能对虚拟机使用无代理备份。而物理机仍然需要基于代理的备份。
2 、 受限快照支持:快照技术不能用于直接连接到虚拟机的存储设备。但是,在大多数情况下,虚拟机使用网络附加存储(NAS)而不是直接连接到存储设备。NAS确实支持快照技术。
3 、 有限的自定义VM代码执行:无代理备份在虚拟机内执行自定义代码方面也不尽如人意。在无代理备份期间,某些自定义代码(例如备份前和备份后脚本以及截断Exchange或 SQL日志)无法执行。
4、无代理备份也跟业务紧密相连,完全依赖了业务提供的相关接口,当某种业务没有提供相应接口或接口能力有限时,为了满足备份业务高级需要,仍需要安装备份客户端。如Oracle、MySQL数据库应用都支持远程备份恢复工具,但在流式备份场景下,还需要安装客户端实现文件备份。此外,为了实现细粒度的备份和恢复,如备份或恢复exchange某个邮件,也需要安装代理软件。
5、站在安全的角度考虑,如果采用操作系统或业务接口进行无代理备份、或发起数据恢复,数据在网络上传输时,容易暴露业务数据甚至密码,也存在安全隐患。这个问题一般需要通过网络链路加密来实现。
6、无代理备份可能也会增加备份窗口,其主要原因就是通过操作系统或应用接口备份时,待备份数据可能需要先缓存在本地磁盘上,然后再传输数据进行备份。如通过远程Dump接口备份时,首先需要把数据导出暂存,然后才备份,增加了备份窗口和额外空间。
<2>有代理备份,在物理和虚拟化服务器的混合环境中,管理员必须对物理服务器使用某种形式的基于代理的备份。在此场景中,管理员可以选择非基于镜像或基于镜像的备份系统。
1)非基于镜像的备份:基于代理的非基于镜像的备份系统旨在恢复丢失、删除或损坏的文件。这些系统可以高性能执行极其精细的文件恢复,但无法恢复运行这些文件的系统。丢失系统以及文件需要冗长的重建和恢复过程,这对于快速恢复来说并不理想。
2)基于镜像的备份:基于代理的基于镜像的备份系统通过抓取整个服务器的驱动器或卷的快照来运行。无需重新安装操作系统和恢复拼凑的文件来复制先前的系统,这对于非基于镜像的系统是必要的。即使完全失败,也可以在几分钟内完成恢复完整的系统镜像。并且,不存在丢失关键文件的可能性,文件级备份和还原过程的风险也是如此。
当下的大多数基于镜像的备份系统也提供与非基于镜像的系统相同的粒度文件恢复。基于镜像的备份系统甚至可以利用增量备份补充完整的备份镜像,其中仅保存自上次备份以来服务器更改的部分。增量备份需要更小的备份集,并且可以提供更多恢复点, 从而降低成本并支持快速恢复时间目标(RTO)。增量备份等功能使基于镜像的备份系统成为物理服务器灾难恢复的标准。
在这里插入图片描述
1 、网络影响:在整个网络中,支持每个虚拟机的代理所需的带宽和CPU开销非常大。而无代理方法有效地避免了这种开销。
2 、可管理性:集中管理,基于策略的管理和虚拟化软件以及用于无代理备份的API使得无代理方法比基于代理的解决方案更易于管理。
3 、投资保护:无代理解决方案支持当下使用的几乎的所有操作系统、数据库和电子邮件格式,并且随着网络的发展,不需要额外的软件或许可证。管理员具有财务自由和技术灵活性,可根据需要扩展资源。
4 、混合环境:为了支持物理和虚拟化服务器的混合环境,管理员可以选择使用基于代理的解决方案和无代理解决方案。在这种情况下,解决方案应支持从相同的控制台使用相同。文件格式的无代理和有代理的备份。

备份一体机单独卸载TINA备份软件
在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

京天不下雨

thanks

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值