1、PlusWell Cluster容错软件运行机制

一:共享的SCSI 和PlusWell Cluster容错软件锁定

PlusWell Cluster容错软件锁定:PlusWell Cluster容错软件管理共享磁盘上的数据,以防止多个服务器在同一时间访问数据。PlusWell Cluster容错软件在逻辑设备级(卷)上控制对数据的访问,并Windows/Linux软件或硬件RAID Controllers 管理物理级。有了PlusWell Cluster 容错软件来管理对共享数据的访问,用户就可以不必担心群中的其它服务器访问数据时,可能会带来的数据访问冲突。PlusWell Cluster 容错软件自动在被应用程序定义为共享资源的磁盘卷上设置锁定。当被保护的应用程序由一个服务器被移动/转换到另一个服务器时, PlusWell Cluster 容错软件控制这些锁定,以保证激活服务器对共享卷的访问。
  在主系统发生故障的情况下, 次节点系统将能够在磁盘上建立SCSI 锁定,并在备份的系统上将资源投入使用。

二:Local Recovery(局部恢复)
PlusWell Cluster容错软件在应用软件的检测时间间隔执行预先定义的行为,以察看资源本身是否失效。如果快速检查和深入检查均局部告失败,系统将尝试局部恢复资源。如果尝试成功,资源将不会向下一优先级的节点进行失效切换(failover)。如果局部恢复尝试失败,系统将向下一优先级的节点进行失效切换。

三:Failover(失效切换)
指定主要的节点或资源失败时,重新恢复资源的过程。一个失效切换通常是没有事先计划的,它将发生在一个被从属系统所检测到并确定为失败的情况下。

四: Switchback(可配置的迁回)
Configurable Switchback(CS )允许PlusWell Cluster容错软件管理员通过命令行或GUI界面来指定资源,其所在服务器发生故障而后又恢复正常,该资源将被自动地切换回到原来节点上。如果选择 Auto Switchback,那么,一旦发生故障的节点回到服务状态时,被配置失效切换的层次都将被切换回到该节点上。如果策略没有选定Auto Switchback,即使当发生故障的节点回到服务状态时,被配置失效切换的层次也会留在它们被失效切换到的节点上,等待由管理员决定合适的时间进行切换。

五: Switchover(正常切换)
指用一个有顺序的方式关闭资源,然后将它们恢复到一个备份系统的过程。这通常发生在当你处于维护或者测试模式中的情况下。这时,没有任何东西失败。

  2. 工作方式
pic2.gif
  在一个激活/备用对中,主节点处于处理状态,从属节点处于备用状态,以防主节点上发生失败。备用系统可以是一个小一点、性能低一点的系统,但是,当主节点失败时,它必须有保证资源可达性的处理能力。例如,假设Server1是主“激活”节点,Server2是次“备用”节点。如果Server1发生故障了,它的被保护资源由 Server2 节点来恢复。当节点Server1恢复后, 资源可以被Server1重新获得。然而,当Server2 节点失败时,Server2节点上并没有需要被Server1节点恢复的资源。
pic3.gif
  在一个激活/激活对中, 两个节点都是激活的处理器,但是它们也可分别作为其对应节点上的资源和资源层次的从属节点。
  在激活/激活的图表中,有两个主要应用:APPA 处于Volume w中,并且在Server1上激活。APPB存储在Volume M上,并且在Server2上激活。在这一配置中,Server1应该是Volume W:资源的主节点,Server2应该是Volume M:资源的主节点。
  当Server2失败时, PlusWell Cluster容错软件应该将Volume M:转换到Server1上去。如果系统资源是足够的,这一转换不会影响到已经在Server1上运行的APPA,转换只是简单地将Server2上的被保护应用程序(APPB)加到Server1的运行负载上