NetApp存储方案及巡检命令

最新推荐文章于 2024-07-09 09:51:37 发布

weixin_30246221

最新推荐文章于 2024-07-09 09:51:37 发布

阅读量1.8k

点赞数

文章标签：数据结构与算法运维

原文链接：http://www.cnblogs.com/cloudos/p/8515574.html

版权

本文介绍了NetApp的MCC（Clustered Metro Cluster）存储双活解决方案，包括其工作原理、演进历程以及4控双活方案。MCC结合SyncMirror、Cluster_remote和控制器Cluster Failover功能，确保在灾难情况下业务不中断。文章还列举了MCC巡检的常用命令，涵盖系统健康、集群状态、硬盘故障等多个方面。

摘要由CSDN通过智能技术生成

一、MCC概述

Clustered Metro Cluster(简称MCC)是Netapp Data Ontap提供的存储双活解决方案，当初的方案是把1个FAS/ V系列双控在数据中心之间拉远形成异地HA Pair，每站点只有单控制器节点，数据中心两站点之间通过额外的FC/VI集群适配器相连，数据中心间SAS磁盘框通过SAS转FC的FibreBridge相连。在500米以内、同一个机房采用直接光纤通道交换机连接；在500米以上(最远100km)采用光纤通道和DWDM交换机相连。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

0?wx_fmt=png

MetroCluster在此架构上也进行了演变。通过在站点A、B两个站点分别放置两套FAS/ V双控阵列，阵列A的A控和阵列B的A控，阵列A的B控和阵列B的B控分别形成集群，这样可以充分把A、B站点数据中心资源充分利用，同时对外提供存储服务；但阵列内的A、B不是集群。如果站点间形成集群Pair的任意一个控制器节点故障，故障站点的主机都需要远程访问远端控制器节点；如何站点间形成集群Pair的两个节点同时故障，就会发生业务中断。

Netapp Data Ontap8.3版本推出了4控双活解决方案，最远支持200公里距离，4控Metro Cluster方案首先由2个HA Pair组成2个本地集群，然后再从2个集群上做4节点集群。集群控制器之间内存日志通过存放在NVRAM里面，NVRAM对没有下盘的日志做了镜像，保证节点故障以后，HA Pair集群的Partner节点能够接管业务；或者站点故障以后，远端HA Pair集群能够接管业务。当日志到达一定水位或者发生系统操作刷盘时，下盘数据同步通过SyncMirror实现主从站点双写，从而确保一个站点磁盘故障以后，另外一个站点磁盘还能提供系统访问，实现站点故障切换，保证业务不中断。

0?wx_fmt=png

MetroCluster使用两个不同地点的镜像和集群来保护数据，每个集群把数据和Storage Virtual Machine (SVM) 配置都镜像同步另一个集群。当某个站点发生灾难时，管理员可以激活远端SVM并在另一站点接管业务。此外，每个集群在本地节点均配置为HA Pair，从而提供了本地故障转移能力。

0?wx_fmt=png

NetApp MetroCluster是以NetApp SyncMirror是配合Cluster_remote和控制器Cluster Failover的功能实现的。

- - Clustered Failover – 在主存储和容灾存储间提供高可用性失败恢复能力，故障接管的决策是由管理员通过单一命令行决定的。
  - SyncMirror – 为远端存储提供即时的数据拷贝，当故障接管时，数据可以仅通过远端的存储进行访问。
  - ClusterRemote – 提供管理机制用以判断灾难的发生并初始远端存储进行接管。

二、MCC巡检常用命令

1、系统健康状态检查

cluster1::> system health status show
Status
---------------
ok

2、集群状态检查

cluster1::> cluster show              
Node                  Health  Eligibility
--------------------- ------- ------------
cluster1-01           true    true
cluster1-02           true    true
2 entries were displayed.

3、集群统计状态检查

cluster1::> cluster statistics show
         Counter             Value         Delta
---------------- ----------------- -------------
       CPU Busy:                0%             -
     Operations:
          Total:                 0             -
            NFS:                 0             -
           CIFS:                 0             -
   Data Network:
           Busy:                0%             -
       Received:            5.78GB             -
           Sent:            13.7GB             -
Cluster Network:
           Busy:                0%             -
       Received:             967KB             -
           Sent:             979KB             -
   Storage Disk:
           Read:            6.38PB             -
          Write:            6.26PB             -

4、查看RAID组信息

cluster1::> aggr show
                                                                      

Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
--------- -------- --------- ----- ------- ------ ---------------- ------------
aggr0_A1   953.8GB   247.3GB   74% online       1 cluster1-01      raid4,
                                                                   mirrored,
                                                                   normal
aggr0_A2   953.8GB   247.3GB   74% online       1 cluster1-02      raid4,
                                                                   mirrored,
                                                                   normal
aggr_data_A1 
           68.93TB   16.04TB   77% online      32 cluster1-01      mixed_raid_
                                                                   type,
                                                                   mirrored,
                                                                   hybrid,
                                                                   normal
aggr_data_A2 
           68.93TB   14.77TB   79% online      31 cluster1-02      mixed_raid_
                                                                   type,
                                                                   mirrored,
                                                                   hybrid,
                                                                   normal
4 entries were displayed.

5、查看节点信息

cluster1::> node show
Node      Health Eligibility Uptime        Model       Owner    Location  
--------- ------ ----------- ------------- ----------- -------- ---------------
cluster1-01 
          true   true        
                            369 days 19:12 FAS8040              gz_idc
cluster1-02 
          true   t