本文属于管理SQL Server AlwaysOn 系列文章
前言:
前面几节提到了如何对AlwaysOn做常规管理,这一节和接下来的一节专门对“监控”进行解释和演示。管理和监控这两个词在很多时候是混淆的,但是我们大概也可以区分出来,比如我做备份,算管理,对错误、异常进行响应这也是管理,但是对错误、异常的捕获和通知DBA这就是监控了,而且监控有时候是不需要进行干预的,比如我监控磁盘空间,当空间充足的时候,我可以不管。
在日常的DBA工作中,我本人对监控的重视程度远大于所谓的管理,因为有了合理的监控,你就可以预见很多问题,实际干预的工作量也会少很多,在很多地方还能进行自动化管理等。还能发现性能问题。所以,我认为在DBA工作中,应该以监控先行为重。另外,监控往往也跟警报绑定在一起,以便触发监控阈值时快速通知责任人。
对于只有少量的可用性组需要监控时,SSMS提供的AlwaysOn仪表板和AlwaysOn健康跟踪(AlwaysOn Health Trace)就可以作为监控的工具。啰嗦了那么多,我们下面进入正式的讲解。
AlwaysOn仪表板(Dashboard):
仪表板是具有一定程度交互的报表界面,用于显示AlwaysOn环境的情况。可以通过下图所示打开:
打开之后会看到这个样子:
从第二个图看到,【同步状态】这一列,会有三种可能的内容:已同步(SYNCHRONIZED)、未同步(NOT SYNCHRONIZING)、正在同步(SYNCHRONIZING)。对于同步副本,应该为“已同步”状态,其他状态都意味着不正常。对于异步副本,却不应该显示“已同步”,而是应该为“正在同步”。但是不管哪种同步模式,“未同步”状态都意味着不正常。
对于同步状态,每个副本还可能有以下几种操作状态: PENDING_FAILOVER , PENDING , ONLINE , OFFLINE , FAILED , FAILED_NO_QUORUM和NULL(当副本未连接时)。详细内容可以从联机丛书中查看:sys.dm_hadr_availability_replica_states 和 角色和操作状态
上图的右上角,有三个超链接:【启动故障转移向导】、【查看AlwaysOn运行状态事件】、【查看群集仲裁信息】,其中第二个【查看AlwaysOn运行状态事件】是一些内置的扩展事件,下节会介绍。第三个包含了现有群集的配置信息,如下图:
接下来在右方的【添加/删除列】中:
点开之后可以看到下面的内容