【存储知识】快照

一、存储快照概念

全球网络存储工业协会SNIA(StorageNetworking Industry Association)对快照(Snapshot)的定义是:关于指定数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像。快照可以是其所表示的数据的一个副本,也可以是数据的一个复制品。

快照的作用主要是能够进行在线数据备份与恢复

① 当存储设备发生应用故障或者文件损坏时可以进行快速的数据恢复,将数据恢复某个可用的时间点的状态。

② 为存储用户提供了另外一个数据访问通道,当原数据进行在线应用处理时,用户可以访问快照数据,还可以利用快照进行测试等工作。

所有存储系统,不论高中低端,只要应用于在线系统,那么快照就成为一个不可或缺的功能。

二、快照实现原理(技术)

当前实现快照有主要有两种技术,一种是写时复制(Copy-On-Write,COW),另一种是写时重定向(Redirect-On-Write,ROW)

相关概念介绍:

源卷:进行快照操作的源数据卷。

写时复制(COW)

在数据第一次写入到某个存储位置时,首先将原有的内容读取出来,写到另一位置处(为快照保留的存储空间,即快照空间),然后再将数据写入到存储设备中。而下次针对这一位置的写操作将不再执行写时复制操作

这种实现方式在第一次写入某个存储位置时需要完成一个读操作(读源位置的数据),两个写操作(写原位置与写快照空间),如果写入频繁,那么这种方式将非常消耗IO时间

所以写时复制适用场景通常为读操作多,写操作少的卷或数据更改局域于某一范围内的卷(原因:同一份数据的多次写操作只会发生一次写时复制)。

写时复制原理:

  • 每个源数据卷都具有一张数据指针表(元数据),简称源数据指针表,表记录就是指向相应源数据块的地址指针。
  • 在创建快照时,存储子系统会建立源数据指针表的一个副本(元数据拷贝),作为快照卷的数据指针表,简称快照数据指针表。
  • 在创建快照之后,这个快照就相当于一个可供上层应用访问的存储逻辑副本,快照卷与源数据卷通过各自的指针表共享同一份物理数据。
  • 当源数据卷中任意数据将要被改写时,COW会在原始数据修改之前进行拷贝到快照卷中,然后将新数据写入到源数据块中覆盖原始数据,并且将原始数据在快照卷中的新地址更新到快照数据指针表记录中,使快照时间点后更新的数据不会出现在快照卷中。

 创建快照

写源数据块

优缺点:

优点:COW 在进行快照操作之前,不会占用任何的存储资源,也不会影响系统性能。

缺点:

  1. 降低源数据卷的写性能。当修改源数据时,会发生三次读写操作:
    1. 读取源数据。
    2. 将源数据写入快照卷中。
    3. 将新数据写入源数据卷中。

    如果主机写入数据频繁,那么这种方式将非常消耗I/O。

  2. 无法得到完整的物理副本。快照卷仅仅保存了源数据卷的部分原始数据。
  3. 拷贝到快照卷中的数据量超过了保留空间,快照就将失效。

写时重定向(ROW)

读写操作重新定向到另一个存储空间中。在一个快照生成期间,所有的写操作将被重定向到另一个介质,而读操作是否需要读重定向,则需要根据读取的位置是否有过自上次快照以来的写重定向,必须对有过写重定向的位置进行读重定向,否则不需要进行读定向。当要创建一个快照时,则将自上次快照以来所有的重定向写数据所对应在源介质中的数据复制出来生成这个时间点的快照,然后再将这些重定向写数据写回到源介质中的相应位置上,从而完成一个快照生成过程。

可以看出在创建快照时,源数据卷状态会由读写变成只读。源卷存放的是上一个快照点的旧数据,新数据最终存放在快照卷中。快照卷数据指针表和其对应得数据没有改变。如果做多次快照,就会产生一个快照链,写操作全都会落到最末端的快照卷中。

这个会出现一个问题。如果一共做了 10 次快照,那么在恢复到最新的快照点时,则需要通过合并 10 个快照卷来得到一个完整的最新快照点数据;如果是恢复到第 8 次快找时间点,那么就需要将前 8 次的快照卷合并成为一个完整的快照点数据。从这里可以看出 ROW 的主要缺点是没有一个完整的快照卷,其快照之间的关系是链式的,如果快照层级越多,进行快照恢复时的系统开销会比较大。但 RoW 的优势在于其解决了 CoW 快照写两次的问题。

 优缺点:

优点:不会降低源数据卷的写性能。源数据卷创建快照后的写操作会被重定向,所有的写 I/O 都被重定向到新卷中,而所有快照卷数据(旧数据)均保留在只读的源数据卷中。因此更新源数据只需要一个写操作,解决了 COW 写两次的性能问题。对于分布式系统来说,正是由于数据的分散,进而提供了并发读的机会。所以在分布式存储上,ROW的连续读写性能比COW好。

劣势:

  1. 没有一个完整的快照卷。ROW 的快照卷数据映射表保存的是源数据卷的原始副本,而源数据卷数据指针表保存的则是更新后的副本。因此,当创建了多个快照时,会产生一个快照链,使原始数据的访问快照卷和源数据卷数据的追踪以及快照的删除将变得异常复杂。在恢复快照时会不断地合并快照文件,造成较大的系统开销。
  2. 单机读性能下降。由于采用了重定向写,使得原本连续的数据分散到了磁盘中,连续写变成了随机写,造成读性能下降。
  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
EMC存储基础知识白皮书是一份详细介绍EMC存储技术的文档。EMC是一家专注于存储设备和解决方案的公司,其产品和技术在数据存储和管理领域广泛应用。这份白皮书通过系统化的方式介绍了EMC存储的核心概念、技术原理和应用场景。 首先,白皮书详细介绍了EMC存储的基本原理。它解释了存储系统如何工作,包括如何组织和管理数据、如何实现高可用性和数据保护。同时,白皮书还介绍了EMC存储的体系结构,包括硬件和软件组件。它介绍了存储容量、性能和可扩展性的概念,并解释了如何通过不同的存储设备组成存储集群来满足不同的需求。 其次,白皮书深入讨论了EMC存储的关键技术。它介绍了EMC的数据压缩和去重技术,这些技术可以大幅度减少存储空间的占用。此外,白皮书还介绍了快照、镜像和克隆等数据保护和复制技术,以及基于云计算的存储解决方案。它还讨论了存储网络技术,如光纤通道和以太网存储,以及与主机和虚拟化平台的集成方式。 最后,白皮书总结了EMC存储的应用场景。它讨论了EMC存储在企业级数据中心、虚拟化环境和云计算中的应用。白皮书还介绍了一些典型的客户案例,展示了EMC存储在不同行业中的成功应用。 总的来说,EMC存储基础知识白皮书是一份全面而详细的文档,介绍了EMC存储的核心概念、技术原理和应用场景。它对于理解和应用EMC存储技术具有重要的参考价值,对存储专业人士和企业决策者都是一份有益的资料。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值