第八章
如何处理认证过程?对可用的选项进行研究。
答:
①Challenge-Handshake认证协议:iSCSI发起者和目标相互证明他们的身份使用章协议,其中包括一种机制来阻止明文密码出现在电线上。
②iSCSI支持两种级别的chap 认证:Initiator authentication和Target authentication
③Initiator 认证要求: 在initiator尝试连接到一个target的时候,initator需要提供一个用户名和密码给target供target进行认证。下面我们称这个用户名密码为incoming账号,即:incoming账号是initiator端提供给target端,供target端认证的账号。
举出一些受益于IP SAN解决方案的数据存储应用。
答:
对于SAN的扩展就是受益于IP SAN解决方案的数据存储应用。
数据丢失的恢复也受益于IP SAN 。
远程办公的应用同样受益于IP SAN解决方案。
FCIP在性能上要考虑哪些主要因素?
答:
从性能的角度来说: 在第二层网络中从不同的交换机上到多FCIP网关的多路径链接消除了单点故障,并提供更高带宽。在长距离的情况下,如果没有足够的带宽,IP网络可能会成为瓶颈。
安全是另一个FCIP解决方案需要考虑的因素,这是因为数据会在公共的IP网络上进行传输。
研究ISCSI环境中的多路径软件,并撰写一份关于ISCSI环境下的EMC PowerPath 软件技术特性和功能的技术说明。
答:
无论什么类型的物理连接,都可以使用基于主机的多路径软件来实现支持容错的主机连接解决方案。PowerPath可以在服务器保持完全可用的情况下完成所有通路的维护、监视和配置工作,减少了计划内故障。普通的连线工作和存储处理器的替换工作可以不关机的情况下完成。
PowerPath Multipathing
将应用程序的可用性及性能发挥到极至,自动实现路径管理,减少复杂性和成本 — 所有这些只需一个路径解决方案多路径存取、工作量平衡、路径故障切换、优化的性能 — 所有这些都将自动化和简化任务。
通过 PowerPath,您能够利用最高的可用性和性能以及业界领先的信息存储系统的所有优点,以满足快速增长的服务级别。
研究NAS设备的ISCSI功能,并提供使用案例。
答:
NAS通过IP网络为客户端和服务器提供服务。大多数的NAS设备支出多接口和网络,这样NAS设备能够作为iSCSI目标存储,使得这些NAS成为一种集中存储,能够提供文件级和块级的数据访问服务。
某公司正在考虑实施存储解决方案。他们没有现有的存储基础设施可以使用,但有一个高性能的网络。讨论在这种情况下是使用本地还是桥接的ISCSI,并对你的推荐给予解释。
答:
本地ISCSI模式的拓扑结构不需要任何FC-SAN组件。但是ISCSI桥接模式的解决方案需要FC组件。
由于这个公司没有现有的存储基础设施可以使用,但是有一个高性能的网络,所以考虑这种情况,应该使用本地ISCSI模式。
在本题中,应用本地iSCSI模式使得此公司只需要存储阵列。而一旦iSCSI发起方或客户端配置了适当的目标存储设备的信息,它就可以连接到阵列,并请求所有可用的LUN。
提供给FCIP的IP宽带似乎是有限的。如果SAN的合并是相当大的,每一边都有500个端口,并在SAN两端经常进行重新配置,请讨论其影响。
答:
在长距离的情况下,如果没有足够的带宽,IP网络可能会成为瓶颈。
因为SAN的合并相当大,每一边的端口都有500个,并在SAN两端经常进行重新配置,所以任何IP网络损坏都会导致合并后的SAN网络不稳定。
例如被分割、过度RSCN和主机连接超时。解决方法是将FCIP流量分流到一个分割的虚拟光钎网络。
对于标准的IP帧,当ISCSI配置为使用MTU值为9 000字节的巨型帧时,将减少多协议开销所占比例。
答:较大的 MTU 通常会减少集成服务器上所需的 CPU 利用量
iSCSI PDU大小为:1460bytes,其中包括有效负载和额外的头部信息。
Jumbo帧的大小为9 000MTU ,其中有效负载为8960。
传输大量数据切割较少时jumbo帧允许在iSCSI PDU中提高一定量的负载。
在桥接ISCSI环境中,为什么MTU值至少为2 500字节?
答:
桥接模式是通过提供iSCSI到FC的桥接功能以实现FC和IP共存。而桥接模式的解决方式需要FC组件。在现有的IP基础设施进行FC块数据传送,使用FCIP一种隧道协议。
FCIP报文中包含的FC帧由五部分组成,其中SCSI数据可达2112字节。
第九章
解释CAS解决方案是如何适合信息生命周期管理策略?
答:由信息生命周期管理策略可知,随着时间变化,信息价值在生命周期间发生改变。在创建之初,数据通常有最高的价值而且使用频繁。随着数据存在时间的不断增加,对数据的访问就不那么频繁了,对组织来说,其价值也在逐步降低。但这些信息依然占据存储空间。为了优化代价,使用不频繁的数据应该存档,这样给有价值的数据留出代价高的空间。CAS是一个提供一种固定内容的安全在线存储与检索,为存档数据的解决方案,它不仅为固定内容提供代价的优化,而且提供了一个更快的更可靠的存储。
在SAN中访问数据,主机采用的物理地址,也被称为逻辑块地址(LBA)。而在CAS中,主机不使用(或不需要)物理地址。为什么?
答:文件级别和块级别数据的访问,通常利用文件名和物理地址定位数据的存储地址和数据的检索。而CAS的数据存储是基于对象的。它为存储对象创建一个全局唯一的内容地址并且不断检查和重新计算存储内容的内容地址。全局唯一的签名保证了一个对象只保存一个实例。这个签名是来源于对象的二进制表示。
IT部门使用磁带来归档数据。说出4到5个主要理由可以说服IT部门使用CAS解决方案,你应该怎样建议才能打动IT部门?
答:要说服IT部门使用CAS解决方案,从CAS解决方案的有点入手。
我们可以从CAS 解决方案的优点入手,来说服 IT 部门使用 CAS 解决方案。
1 数据内容的真实性、完整性、位置无关性。数据一旦存储,就不可以被多次复制,满足一般的商业需求。
2 单实例存储。简化了存储资源管理任务,特别是在处理数百 TB 的固定内容时。
3 记录快速检索。在 CAS中,随机磁盘访问,能够快速检索出相应的记录。
4 技术开放性。只要应用服务器能够映射原始内容地址,那么数据就可以被访问。
5 数据更好的强制保留期和记录级保护和处置。所有的固定内容在 CAS中只存储一次,但会采用某种数据保护方案对其进行备份。
第十章 存储虚拟化
1、VLAN虚拟化是做什么的?讨论VLAN作为虚拟化实施的技术。
答:(1)VLAN 是虚拟的 LAN,也就是虚拟局域网,它提供了一种简便、灵活、便宜的方式来管理网络。
(2)VLAN 使得大型的网络更易于管理,可通过集中配置位于不同物理位置的设备来实现。通过应用网络配置软件,位于第 2 层的交换机接口可以逻辑的集中在一起,建立一个独立的、虚拟局域网。
(3)VLAN 简化了网络认证。VLAN 中的端口只允许连接到所需的特定网络端口号,这使得其他未使用的端口被应用到其他的 VLAN 中。
(4)当需要扩展时,通过软件命令,额外的端口可以添加到已经存在的 VLAN 中。如果一个机器需要移动到一个不同 IP 的网络中时,端口可以被重新分配到一个不同的 VLAN 中,而不需要物理的移动电缆。
研究SNIA的存储虚拟化分类,并撰写一份短的技术说明。
答:SNIA 即存储网络工业协会,对于存储虚拟化分类给出了系统的存储虚拟化分类方法,对是什么、在哪里以及如何实现虚拟化存储有三个层次界定。
(1)第一个层次的存储虚拟化分类定义“创建什么”。它指定虚拟化的类型:块级虚拟化、文件虚拟化、磁盘虚拟化、磁带虚拟化或任何其他设备的虚拟化。
(2)第二个层次描述虚拟化定义“在哪里”进行。这需要一个多层次特点的虚拟化方法。
(3)第三个层次描述虚拟化存储“如何实现”,这需要一个有效的虚拟化环境将集中的管理和控制进行职能分布。在所有三个层次的存储环境上刻画虚拟化:服务器、存储网络、存储。一个有效的虚拟化环境会将集中的管理和控制职能分布在三个层面。数据存储功能(如磁盘阵列、高速缓存、校验和硬件扫描)都应当留在阵列内完成。同样,主机应重点控制应用,如故障转移集群和应用错误恢复以及磁盘阵列的卷管理。所以,路径重定向、路径故障切换、数据访问和分配或负载平衡的处理应移动到交换机或网络上。
块级虚拟化如何实施才能成为一种数据迁移工具?解释数据迁移将如何完成并讨论用这种方法储存的优势。用这种方法与较传统的迁移方法作比较。
答:传统的数据迁移需要物理的改变服务器到新的存储阵列位置的重新映射,这导致应用程序宕机以及物理的改变。在一个虚拟的环境中,虚拟卷被分配到主机的物理存储池。数据迁移是通过这些虚拟卷实现的。将一个虚拟化软件执行的 I / O 重定向一个物理位置到另一个地方。尽管是物理上的I / O重定向到一个新的位置,虚拟化软件将虚拟卷的地址提交给主机的变化。这是通过虚拟寻址。这使得过程透明和非破坏性的主机。此外,自复制和重新映射是通过虚拟化系统,不需要主机循环,释放服务器。
通常情况下,数据中心用新存储阵列取代旧的存储阵列,以利用技术进步来提高成本效益,并满足业务增长的要求。现在在数据中心数据从旧阵列迁移到新的阵列已成为一个例行的活动。做一个基于主机的、基于存储阵列的和基于虚拟化设备的迁移方法的回顾,详细说明其优点和缺点。考虑迁移的情况是将数据从DAS环境迁移到SAN环境。
答:(1)基于主机的数据迁移:这种数据迁移模式不依赖于存储设备品牌、架构,但与操作系统、应用相关,需要在系统和应用层面作大量工作,该种方案会大大占用主机资源,影响业务的正常运转。
(2)基于存储设备的数据迁移:要求迁移的源存储和目的存储为同一厂商的同构存储,需要购买数据复制 license,所以该方案局限性大。
(3)基于存储虚拟化技术:具有虚拟化功能的存储系统,在实现后端存储统一池化管理的基础上,还可提供透明管理的功能,再结合卷镜像功能,实现在不影响业务正常运行的情况下,无缝将数据迁移到虚拟化存储设备中。
参阅问题4。你将使用哪种迁移方法?制定一个简短的演讲,解释为什么你建议这个特定的方法。包括执行您建议的迁移方法的工作明细结构。
答:
考虑到迁移情况是将数据从DAS环境迁移到SAN环境中,我建议使用的是存储虚拟化技术中的文件级别的迁移。
文件级虚拟化致力于消除NAS环境中的文件访问和文件集存储位置之间的依存关系,这为优化存储利用率、整合服务器和执行不间断文件迁移提供了实现的可能性。可采用Rainfinity解决方案。
第十一章 业务的连续性
1、某网络路由器的失效率为每1 000小时0.02% 。那么该部件的MTBF是多少?
答:网络路由器的MTBF = 1 / 失效率
= 1 000 / O.O2 %
= 5 000 000 小时
2.银行的IT部门承诺在每周一到周五上午9点至下午4点用户可以获取货币转化率表。IT部门则在上午8点从主机系统中获得反馈更新表,更新过程需要35分钟完成。在某周四由于数据库损坏,转化率表无法更新。在上午9点5分,发现了该表出现错误。接下来就是重新进行更新过程,在9点45分完成了标的重建。然后,用了15分钟进行验证后转化率表对各银行分支可用。当假设无其他情况发生时,在故障发生时,这一周转化表的可用性是多少?
答:可用性 = 总的系统的正常运行时间 / 总的预定时间
总预定时间 = 7 * 5 = 35 小时
总系统正常运行时间 = 34小时(因为周四是10点可用的)
所以,这一周转化表的可用性是 34 / 35
3.“采用9的数目表示可用性”,请使用例子解释9的数目表示可用性的实用性。
答:每年正常运行时间是基于服务器的准确性、及时性的要求的,这个计算的数量会导致“9的数目”表示可用性指标。
例如,一个服务器有5个9的是可用性表示在一年中99.999%的计划时间内(24 * 365)都能提供其功能服务。系统的正常运行时间比例是99.999%,停机时间是比例0.001%,每年的停机时间是5.25分钟,每周的停机时间是6秒。
4.给出在数据中心操作情况下计划和非计划的停机时间例子。
答:计划停机的例子:安装/集成/维护新的硬件、软件升级或补丁,备份,应用程序和数据重新存储,设备运行(改造和建设),更新/迁移生产数据的环境测试。
非计划停机的例子:数据库损坏造成的故障,组件故障和人为错误。
5.集群化如何帮助最小化RTO?
答:1个小时RTO :采用基于磁盘镜像功能的集群生产服务器。
秒级RTO : 采用具有双向镜像功能的集群生产服务器,使得应用程序可以同时运行在两个不同站点。
6.在与RTO和RPO相关情况下如何选择恢复位置策略(冷或热)?
答:RTO 和RPO 的短时间恢复采用热站点的磁盘备份中恢复。
RTO 和RPO 的长时间恢复采用冷站点的磁盘备份中恢复。
7.假设下图给出了存储配置设计情况。说明在这种情况下的单点故障分析,并给出消除所有单点故障的转换配置。
答:单点故障:主机、交换机、存储阵列,HBA,数组端口和路径
避免SPF备用配置如下所示:
第十二章
某制造公司在整个组织结构中采用磁带作为其主要备份存储介质。每周日进行一次全备份,在周一到周六进行增量式备份。运行环境中包括多个备份服务器用以不同分组的服务器。
在备份过程中,电子邮件和数据库应用必须中断。由于是集中化的备份环境,可恢复行经常折中处理。在完全故障情况下,为了进行全恢复必须有许多的磁带需要映射,那么恢复时间将是非常漫长的。
公司非常愿意部署一个易于管理的备份环境。他们希望能够减少电子邮件和数据库应用中断的时间,并减少在故障情况下为了完全恢复服务器而需要使用的磁带数量。
请根据公司的要求提出一个备份恢复解决方案,并证明该方案能够满足公司的需求。
答:
解决方案应包括以下几个因素:
集中式备份服务器
备份代理,避免关键应用的要求在备份期间被关闭
采用累积式备份而不是增量式备份,减少完全恢复时磁带的数量
在某文件共享NAS环境中具有有限的备份设备。请建议一个合适的备份实现方案,该方案能极小化网络流量,避免任何拥塞,并同时不会影响生产操作。说明你的方案。
答:
在NAS环境中,备份可通过4中不同方式进行:
基于服务器
无服务器
网络数据管理协议(NDMP)双路
网络数据管理协议(NDMP)三路
此处的实现应通过NDMP。NDMP促进NAS和备份设备之间的数据传输。
由于其灵活性,不再需要通过备份服务器传输数据。从文件直接发送数据到备份设备,而元数据被发送到备份服务器进行跟踪。这样就降低了备份服务器的负载并提高了备份速度。
此解决方案满足备份策略需要集中管理和控制分布式数据,同时最大限度地减少网络流量。
NDMP 可以管理和传输网络上自动控制的带库数据。由于可以在带库和 NAS之间实现高速连接,因此使得备份和恢复的速度得以优化。
NDMP三路在当有限的备份设备环境中是很有用的。这种方法使NAS头控制备份设备与其他NAS头以NDMP接受备份备份数据的方式共享备份设备。
讨论备份环境的安全性关注的问题。
答:
备份环境的主要安全问题是备份服务器的欺骗,备份客户端或备份节点被未经授权的主机允许进入备份数据。
另一个问题是备份磁带丢失、被盗,或是错误的,特别是如果磁带包含高度机密的信息。备份到磁带的应用程序如果不加密数据备份,也容易受到安全的影响。
最后,备份数据的粉碎也应该通过安全考虑,如果他们不再需要,磁带应将数据擦除或覆盖。
在实现备份方案时,有哪些业务和技术问题是需要纳入考量的?这些考虑是如何影响备份方案和实现的?
答:
数据丢失的数量、 RTO(恢复时间目标)、RPO(恢复点目标)是在选择和实现特定的备份策略时首先需要考量的
另一考虑因素就是留存周期,即定义了业务需要备份复制的持续时间
文件的位置、大小及其数目因其影响备份过程,也应纳入考量
在实现备份时也依赖于备份介质的类型、备份粒度
执行备份和可用的备份时间窗口,以及恢复操作的位置和时间
运行操作备份、灾难恢复和归档的目的是什么?
答:
可操作备份是一种在时间点上的数据备份,用于在例行处理过程总发生的数据丢失和逻辑损坏时对数据的恢复。
灾难恢复时当主位置因灾难而不能工作时,备份的复制将用于在另外的位置恢复数据。
归档是为了按照一些法规的要求长期保存业务记录。
列出并说明在采用磁带作为备份技术时的考虑因素。在该环境总的主要困难是什么?
答:
由于磁带的低成本性、可离线复制性,磁带被广泛应用于备份的实现。
但在其优势存在的同时,也不可避免的存在一些劣势,具体如下:
该环境中的主要困难是可靠性差,磁带必须放在受控的环境下以确保介质的保存和防止数据损坏。
数据读写对磁道来说是串行的,这样会使备份和恢复操作变慢,而且磁道的运输也会增加管理上的开销。
综上所述,磁带目前的主要困难为:
靠性 ②恢复性能 ③传输/处理问题 ④只能顺序访问 ⑤须由空调控制环境
描述采用“虚拟磁带库”与“物理磁带”相比所具有的优势。
答:
对比优势如下表所示。
特征 虚拟磁带库 物理磁带
离线能力 是 是
可靠性 是 无原生保护方法
性能 更快的单数据流 受限于机械操作和装载时间
用途 仅备份 仅备份
第十三章 本地复制
本地复制中,可恢复性和一致性的重要性体现在哪里?
答:一致性在异步复制数据的可恢复性中依然扮演着一个至关重要的角色。关键是要理解特殊业务功能各相关数据组件之间的相互依赖性,确保它们之间在目标位置的任一指定时间点上是一致的。尽管它们有可能落后源系统,但是只要后来它们是相同的,功能和应用程序就应该能够恢复。
可恢复性是卷在发生数据丢失或数据损坏时,数据副本可以用于恢复丢失的数据。可恢复性必须提供在生产卷上重启任务操作的最小的RPO和RTO。
描述多种事物操作中本地副本的应用。
答:替代源用于备份;快速恢复;决策支持活动;测试平台;数据迁移。
为了保证事务的完整性,要求数据库按照一特定的顺序来执行一系列写操作,这写操作将会被记录在不同的设备/文件系统上。
当副本被创建时,所有对源设备的写操作都必须由副本设备捕获到以保证数据一致性。
从本地副本执行备份需要考虑什么因素?
答:源和复制副本的PIT应该是一致的。数据丢失的多少以及用RTO和RPO衡量业务能容忍的停机时间是选择实现特定备份方案策略的主要考虑因素。再者就是留存周期,即业务需要备份复制的持续时间。
根据留存时间和数据可获取性,备份介质的类型也需要的考虑因素。组织结构必须考虑备份的粒度。备份策略的制定必须确定一个进行备份的最佳的时间,以求把任何对生产性操作的干扰降到最低。
文件的位置、大小及其数目因其影响备份过程,也纳入考量。对于将要备份的数据其位置是非常重要的考虑因素。许多组织结构具有非常多的异构平台以支持复杂方案,例如从许多源中使用备份数据的数据仓库环境就是这样的。备份过程必须以相互作用和内容完整性方式说明这些源,且该过程必须保存数据的所有异构型平台协作下完成。
文件的大小也影响备份过程。备份大文件也许使用比备份同等数据量但是由多个小文件组成的数据更少的资源。当文件系统包括多个小文件时,备份和恢复将占用更多的时间。
备份文件数目也影响备份过程。例如,在增量式备份,具有1000000文件而且日常变化率为10%的文件系统将不得不在备份目录中创建100000个入口。备份性能也依赖于备份所用的介质。在基于磁带系统中时间较长的启动停止操作将会影响设备的性能,特别是在备份大量小文件的时候。
本地副本的数据是否是源数据的最新复制以及数据是否完整。
使用本地副本进行恢复操作和再同步操作有什么不同?举例说明。
答:恢复操作中,源数据与目标数据是同步的,如果源包含一个数据库,当逻辑数据发生损坏时,数据是可以依据最近的PIT源副本恢复的并做出增量复制操作。
再同步操作中,目标数据与源数据同步,目标从源分离后,源和目标数据都被主机更新。经过一段时间后,目标需要与源数据同步。为此,目标与源取得连接并进行增量再同步操作。
一个300GB的数据库需要两个本地副本用于报告和备份,但因为各种限制现在无法提供全容量的副本。该数据库配置了15块硬盘,每天的更新率约为25%,请为该数据库配置两个基于指针的副本,描述你需要副本空间大小以及需要配置的保存区域的大小。
答:副本空间要75GGB;
需配置的保存区域是0空间或容量分配,因为它是基于指针的复制品。
对于问题5中所描述的数据库,如果不存在空间限制,讨论全卷镜像配置的优势。
全卷镜像的目标附着于源上。作为源的一个镜像。源上存在的数据复制到目标,源上新的更新也更新到目标。将整个源数据备份到目标设备,再同步(或恢复)操作,只需要复制被修改过的数据块,避免了完全同步(或恢复)操作,该方式大大降低了这些操作的执行时间。对源的性能没有影响且恢复时源的可访问性无要求。
一个管理员为一个LUN配置了基于六个指针的虚拟副本,并为该LUN创建了八个全卷副本,然后该管理员为各全卷副本创建了基于四个指针的虚拟副本,现在一共多少个可用的副本?
答:共有6+8+4*8=46个可用的副本。
第十四章 远程复制
一个机构正在规划数据中心迁移。他们最多能承受两个小时的停机时间来完成迁移。解释如何使用远程复制技术来满足这个停机时间需求。为什么其他方法不能满足这个需求?
答:采用基于SAN的远程复制技术。基于SAN的远程复制技术能够在异构的存储阵列上实现数据的复制。数据通过SAN/WAN从一个阵列移动到另一个阵列上,这种技术独立于应用程序和服务器操作系统,因为复制操作由其中一个存储阵列来完成。这不会影响服务器的工作,也不会影响LAN。可以避免使用停机时提供无干扰的数据迁移。
传统的方法从一个地方迁移数据到其他地方,需要停机时间过长。
分别解释同步、异步和磁盘缓存远程复制的RPO。
答:在同步远程复制中,必须在通知主机“写完成”之前将写操作提交给源和目标。在先前的写操作完成并通知主机之前不能进行额外的写操作,这就保证源上的数据与副本在任何时候都是相同的。后续的写操作以和在源上接收的相同顺序进行传输,因此维护了写操作的顺序。如果源发生故障,同步远程复制将提供零或者接近于零的RPO以及最低的RTO。
在异步远程复制中,一个写操作提交给源之后立即通知主机。数据先缓存在源站点,之后再传输给目标站点,这样消除了对应响应时间的影响。远程站点上的数据将落后于源上的数据至少缓冲区长度的大小。因此,异步远程复制提供了一种有限(非零)RPO的灾难恢复解决方案。RPO依懒于缓冲区的大小、网络带宽和源端的写负载。
在磁盘缓存的复制模式结合了本地复制和远程复制两种技术。首先为源创建一个一致性的PIT本地副本,副本数据稍后被复制到一个远程阵列。如果源发生故障,源站点创建的众多本地副本的最后一个如果传送到远程站点,那么RPO是距最后一个副本所恢复的时间;如果源站点的初始副本都未传输到远程站点,则RPO最坏将是距初始副本的恢复时间。
讨论下列三站点间复制的实现方式中,掩体站点失败时所产生的影响。
多跳—同步+磁盘缓存
多跳—同步+异步
多个目标站点
答:多跳—同步+磁盘缓存 掩体站点失败时,与同步+异步方式相同。掩体站点处发生灾难或者源与掩体站点之间的网络连接失败,源站点将继续其操作,不过这时将没有远程副本保护。
多跳—同步+异步 如果在掩体站点发生灾难或如果有网络链接失败,源和掩体站点之间,源网站将继续正常运行但没有任何远程复制。这种情况非常类似于two-site复制/灾难发生故障时的目标站点。对远程站点的更新不能由于故障发生的掩体网站。因此,在远程站点的数据一直落后,但是这里的优势在于,如果源失败也在这段时间里,在远程站点操作可以恢复。在远程站点的RPO取决于掩体站点故障和源之间网站的失败的时差。
多个目标站点 掩体站点的失败或远程站点不被认为是一场灾难,因为正常的操作可以继续在源站点而远程灾难恢复可以保护并仍然可用的网站。网络链接失败掩体网站(目标1)或远程站点(目标2)允许业务继续,不间断在源站点远程灾难恢复保护,仍然是可用的网站。
讨论下列三站点间复制的实现方式中,源站点失败所产生的影响以及可用灾难恢复方案。
多跳—同步+磁盘缓存
多跳—同步+异步
多个目标站点
1.多跳—同步+磁盘操作
答:源站点失败,掩体站点的远程副本是最新的源站点数据,但是之后得不到源站点的数据,发送给远程站点的数据也是过时的。数据一致性得不到保障。可用基于磁盘缓存的远程复制技术从掩体站点站点创建PIT本地副本,然后将这个副本传输到源站点,恢复源站点的数据。
2.多跳—同步+异步
答:源站点失败,操作就转换到掩体站点上,这时将是零数据丢失或者是接近于零数据丢失,掩体站点与第三站点间的RPO是分钟级的。可用基于阵列的同步复制技术反向从掩体站点恢复源站点的数据。
3.多个目标站点
答:源站点失败,掩体站点和远程站点的数据都得不到一致性保证。可用基于阵列的远程复制技术来通过掩体站点恢复源站点的数据。
在平均I/O大小32KB情况下,一个主机在峰值状态下每秒生成8000次I/O。在峰值使用期间,目前测得的平均响应时间为12ms。当实现同步复制后,如果到远程站点的连接采用光钎通道,并且网络延迟是每次I/O 6ms,则主机的响应时间是多少?
答:目前测得的平均响应时间为12ms
网络延迟是每次I/O 6ms
数据传输时间=32 * 1024/8000
实际响应时间= 12 +(6 * 4)+(32 * 1024/8000)= 40.096
研究在NAS环境中的各种远程复制方案,请给出其中哪种类型的复制方案最适合与NAS技术集成?
答:NAS的远程复制方案大致分为3种:利用数据库复制技术,文件系统复制技术和将镜像技术归于存储系统的卷(或块)复制技术。
①数据库复制
关系数据库管理系统能对本地和远程支持做出熟悉和灵活的决定。可以应用数据库的成熟技术,实现数据的同步、异步复制、灾难恢复、事务回退等容错技术。在这种情况下,必须使用其它远程复制行为覆盖用户文件和系统文件。
②文件系统复制
对于具有多种应用程序的主机来说,采用文件系统远程镜像比较合适,尤其适合用于低配置的服务器,文件级别的复制能够圆满完成替代位置数据的更新。
③卷(或块)级复制
卷(或块)复制可以在主机或者存储子系统实现,这种技术可以复制逻辑卷或在某些情况下复制物理卷。卷复制支持所有文件系统和任何卷管理器配置的任何未加工数据。
代码实现的IP SAN
实现一个完整的 IP SAN(存储区域网络)系统涉及许多复杂的技术和组件,包括网络通信、存储管理、数据传输、安全性等。这里提供一个简单的示例,用Python模拟一个简单的IP SAN系统,其中包含基本的存储和访问功能。
class IPSAN:
def __init__(self):
self.storage = {}
def create_volume(self, volume_name, size):
self.storage[volume_name] = bytearray(size)
def write_data(self, volume_name, offset, data):
if volume_name in self.storage:
volume = self.storage[volume_name]
volume[offset:offset+len(data)] = data
else:
print("Volume not found.")
def read_data(self, volume_name, offset, length):
if volume_name in self.storage:
volume = self.storage[volume_name]
return volume[offset:offset+length]
else:
print("Volume not found.")
# 示例用法
if __name__ == "__main__":
ipsan = IPSAN()
ipsan.create_volume("volume1", 100) # 创建一个大小为100字节的卷
ipsan.write_data("volume1", 0, b"Hello") # 在卷的起始位置写入数据
data = ipsan.read_data("volume1", 0, 5) # 从卷的起始位置读取数据
print("Data read from volume1:", data)
这段代码实现了一个简单的 IPSAN 类,其中包含了创建卷、写入数据和读取数据的功能。IPSAN 类使用一个字典来模拟存储设备,其中键是卷的名称,值是存储在卷中的数据。这个示例只是一个简单的模拟,实际的 IP SAN 系统包含了更多的功能和复杂性。
结语
在当前,存储与信息管理技术领域涌现出许多创新和发展,其中一些最新的技术包括:
-
云存储和多云战略:云存储已经成为许多组织的首选,它提供了灵活性、可扩展性和成本效益。而多云战略则是将工作负载分布在多个云服务提供商之间,以降低风险和避免厂商锁定。
-
对象存储:对象存储是一种数据存储模式,其中数据以对象的形式存储,每个对象都有其唯一的标识符。对象存储通常用于大规模的数据存储和分析工作负载。
-
软件定义存储 (SDS):SDS 将存储功能从专用硬件中解耦出来,通过软件实现存储功能,从而提高灵活性、可扩展性和成本效益。
-
NVMe (Non-Volatile Memory Express):NVMe 是一种高性能、低延迟的存储协议,专为固态硬盘 (SSD) 设计。NVMe 提供了更快的数据传输速度和更低的延迟,使其成为高性能存储解决方案的首选。
-
存储虚拟化:存储虚拟化技术允许将多个存储资源池化在一起,并通过统一的管理界面管理和配置这些资源。这提高了存储资源的利用率和管理效率。
-
容器存储:随着容器化技术的普及,容器存储也变得越来越重要。容器存储解决方案旨在为容器化应用程序提供高性能、可靠的持久性存储。
-
持续性内存 (Persistent Memory):持续性内存是一种新型的存储介质,具有内存级别的速度和持久性存储的特性。它正在改变传统存储层次结构,并推动新型应用程序的发展。
以上技术都在不断发展和演进,为存储与信息管理领域带来了新的可能性和挑战。