一、MCC概述
Clustered Metro Cluster(简称MCC)是Netapp Data Ontap提供的存储双活解决方案,当初的方案是把1个FAS/ V系列双控在数据中心之间拉远形成异地HA Pair,每站点只有单控制器节点,数据中心两站点之间通过额外的FC/VI集群适配器相连,数据中心间SAS磁盘框通过SAS转FC的FibreBridge相连。在500米以内、同一个机房采用直接光纤通道交换机连接;在500米以上(最远100km)采用光纤通道和DWDM交换机相连。
MetroCluster在此架构上也进行了演变。通过在站点A、B两个站点分别放置两套FAS/ V双控阵列,阵列A的A控和阵列B的A控,阵列A的B控和阵列B的B控分别形成集群,这样可以充分把A、B站点数据中心资源充分利用,同时对外提供存储服务;但阵列内的A、B不是集群。如果站点间形成集群Pair的任意一个控制器节点故障,故障站点的主机都需要远程访问远端控制器节点;如何站点间形成集群Pair的两个节点同时故障,就会发生业务中断。
Netapp Data Ontap8.3版本推出了4控双活解决方案,最远支持200公里距离,4控Metro Cluster方案首先由2个HA Pair组成2个本地集群,然后再从2个集群上做4节点集群。集群控制器之间内存日志通过存放在NVRAM里面,NVRAM对没有下盘的日志做了镜像,保证节点故障以后,HA Pair集群的Partner节点能够接管业务;或者站点故障以后,远端HA Pair集群能够接管业务。当日志到达一定水位或者发生系统操作刷盘时,下盘数据同步通过SyncMirror实现主从站点双写,从而确保一个站点磁盘故障以后,另外一个站点磁盘还能提供系统访问,实现站点故障切换,保证业务不中断。
MetroCluster使用两个不同地点的镜像和集群来保护数据,每个集群把数据和Storage Virtual Machine (SVM) 配置都镜像同步另一个集群。当某个站点发生灾难时,管理员可以激活远端SVM并在另一站点接管业务。此外,每个集群在本地节点均配置为HA Pair,从而提供了本地故障转移能力。
NetApp MetroCluster是以NetApp SyncMirror是配合Cluster_remote和控制器Cluster Failover的功能实现的。
-
-
-
Clustered Failover – 在主存储和容灾存储间提供高可用性失败恢复能力,故障接管的决策是由管理员通过单一命令行决定的。
-
SyncMirror – 为远端存储提供即时的数据拷贝,当故障接管时,数据可以仅通过远端的存储进行访问。
-
ClusterRemote – 提供管理机制用以判断灾难的发生并初始远端存储进行接管。
-
-
二、MCC巡检常用命令
1、系统健康状态检查
cluster1::> system health status show Status --------------- ok
2、集群状态检查
cluster1::> cluster show Node Health Eligibility --------------------- ------- ------------ cluster1-01 true true cluster1-02 true true 2 entries were displayed.
3、集群统计状态检查
cluster1::> cluster statistics show Counter Value Delta ---------------- ----------------- ------------- CPU Busy: 0% - Operations: Total: 0 - NFS: 0 - CIFS: 0 - Data Network: Busy: 0% - Received: 5.78GB - Sent: 13.7GB - Cluster Network: Busy: 0% - Received: 967KB - Sent: 979KB - Storage Disk: Read: 6.38PB - Write: 6.26PB -
4、查看RAID组信息
cluster1::> aggr show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ aggr0_A1 953.8GB 247.3GB 74% online 1 cluster1-01 raid4, mirrored, normal aggr0_A2 953.8GB 247.3GB 74% online 1 cluster1-02 raid4, mirrored, normal aggr_data_A1 68.93TB 16.04TB 77% online 32 cluster1-01 mixed_raid_ type, mirrored, hybrid, normal aggr_data_A2 68.93TB 14.77TB 79% online 31 cluster1-02 mixed_raid_ type, mirrored, hybrid, normal 4 entries were displayed.
5、查看节点信息
cluster1::> node show Node Health Eligibility Uptime Model Owner Location --------- ------ ----------- ------------- ----------- -------- --------------- cluster1-01 true true 369 days 19:12 FAS8040 gz_idc cluster1-02 true t