在本系列三部分的前面两个部分,我们看了一下微软ClusDiag工具的安装过程,以及它一些有用的报告能力。在第三部分中,我们会审视该工具强大的故障排除功能,包括对集群日志文件的处理、过滤以及使用颜色编码的事件。
就像本系列之前的部分所提到的,ClusDiag有以下两种操作模式:
* 在线模式——用于配置的验证与报告
* 离线模式——用于对集群和事件日志的诊断
在使用该工具进行诊断之前,请牢记,你必须首先获取日志(就像在第二部分中所描述的)或者使用微软的平台支持报告工具(MPS Reports)去收集诊断用数据。
ClusDiag特别设计为可以读取MPS Reports,以便为远程服务器提供诊断数据。实际上,MPS Reports是微软技术支持用于收集诊断数据的主要工具。MPS Reports拥有多个版本,而你的选择依赖于你需要诊断哪种类型的配置(集群、活动目录、性能或设置等)。为了我们的用途,你将使用MPS Reports的集群版本去收集所需的数据,并将数据提取到一个文件夹中。你可以通过微软的网站找到MPS Reports的概述,以及如何去下载该工具的一个免费副本。
一旦你已经使用ClusDiag或者MPS Reports收集到数据之后,下一步就是采用离线模式调用ClusDiag。为了实现这一步骤,可以简单地通过单选按钮选择离线模式,然后使用箭头或者浏览按钮去指定日志文件所在的路径。如图1所示。
图1
这样一来,ClusDiag就会读取信息并建立一个非常类似于集群管理工具(Cluster Administrator utility)的视图。它会列出各种节点、组、资源以及日志文件,并会高亮在左面板中的任何集群对象,在右面板中提供其详细的信息。请看图2给出的ClusDiag处于离线模式的一个例子。
图2
点击图片本身就能放大
在左边,你可以看到各种日志文件被分组为所有文件(All Files)、事件日志(Event Logs)以及测试和集群日志(Test and Cluster Logs)。展开左面板的日志文件树,相应的会在右边显示各种日志文件。点击右面板中的任意一个日志文件,会调出合适的阅读器。比如,如果你点击一个事件日志文件(EVT event log file),事件阅读器就会打开这个EVT文件,如图3所示。
图3
同样地,如果你点击一个集群日志文件,一个显示集群日志内容的阅读器会相应的启动。默认情况下,ClusDiag以过滤地形式显示集群日志文件,并会根据严重性对每一个条目进行颜色编码。信息化的条目使用黑色来显示,警告使用栗色,而错误则使用红色。这样的颜色编码有助于你快速地识别哪些记录是噪音或者信息化的输出,而哪些是警告和错误。你可以通过使用下拉菜单“View”并选择“Color Code”来定制颜色编码以及过滤标准。图4是集群日志的一个例子,其中用红色显示错误信息条目。
图4
您可以同时在不同的面板里面打开多个集群日志文件,那样就可以快速从一个节点跳跃到另一个节点。您也可以右击一个条目,调出一个上下文敏感菜单(context sensitive menu),然后或者选择同步时间戳(Synchronize Time Stamp)并采用时间戳,或者选择同步全局更新管理器(GUM Global Update Manager)并使用其序列号,来同步多个日志文件里的条目。在图5中,你可以看到使用ClusDiag同时显示三个群集日志文件的例子。
图5
最后,ClusDiag最方便的特征功能之一,是让您能够根据时间戳合并多个集群日志。该特征可以让您查看一个单一的日志,而该日志是对多个节点的日志进行合并后的结果。而且,该工具还会对其背景进行高亮,以区分哪些日志属于哪些节点。该特征功能的使用方法,是首先在保持ctrl键被按下时选中多个集群日志,然后点右键去调出上下文敏感菜单(context-sensitive menu),并在所选文件中查找(Find In Selected Files)。图6给出了一个合并后的集群日志的例子,其中来源于不同节点的记录用不同的颜色标注。
图6
那么这个有关ClusDiag的系列文章将就此结束。您仍然可以通过对完整的在线帮助的探究找到其它一些有用的功能选项,比如说使用格兰威治标准时间(GMT)对比本地时间的方式来显示记录,或者使用Ctrl-T来跟随集群日志中不同的线索。尽管如此,您已经可以清晰的看到,ClusDiag的在线报告能力以及离线诊断工具,是为Windows管理员提供的一个管理Windows服务器集群的强大工具。