最后更新2021/07/14
这是一组逻辑组件,由几种软件组合在一起,实现小型机、分区、HMC之间通信和控制,CSM、RMC和RSCT互相交织在一起,互相调用。作者作为IBM和Power系统及AIX的Fans通常会接受一切IBM的新技术,对其优点大加颂扬,对其缺点尽可能地辩护,可是IBM经常时不时地弄出些自以为很美,用户使用起来要吐的古怪东西。CSM、RMC和RSCT就是最著名的几例,如果要追溯历史上其他类似的产品,能超越这三者的只有PSSP,这是IBM SP小型机(也就是和卡斯帕罗夫下国际象棋的那种结构的小型机)的管理软件。在此我能为IBM进行辩护的唯一论点是IBM超越了时代,没有想到她的用户不都是数学家。
RSCT、RMC、CSM三者在当前AIX虚拟化环境中越来越重要,很多分区动态操作动作都是由这三者结合来实现的。RSCT用于建立HMC与分区之间的通信链路;RMC则通过RSCT控制分区资源的识别,进而实现动态资源调整(Dlpar功能);CSM则与HMC操纵分区安装和重启动过程相关,属于NIM网络安装的辅助功能。
CSM、RSCT与AIX补丁之间有一定的对应关系要求,通常AIX的某个版本及补丁,包含了或者必须要对应版本的RSCT、CSM。CSM、RSCT可安装的版本可以从AIX的安装盘中找到,而补丁则需要从IBM网站下载。另外HACMP/Power-HA的光盘上也有可安装的RSCT,但版本不一定匹配。
RSCT本质上是群集管理软件,目的是为了管理群集内各节点,实现单点管理,但RSCT本身并不具有管理功能,只能作为管理的基础,提供节点间通信功能。这些在同一管理域内的节点被称为peer,管理域被称为peer domain。RSCT中重要的管理功能来自Configuration Resource Manager即CRM。当安装AIX或者单独安装RSCT时,peer domain被自动创建,同时RSCT还会调用preprpnode命令,此命令设置可信的主机、IP地址。RSCT另外也初始化了一个与ACL有关的控制文件: /var/ct/cfg/ctrmc.acls。此配置允许其它节点访问所有在同一个peer domain中节点的资源。
由于RSCT通过peer domain授权支持其它节点访问本身信息,因此最常见的错误就是“Permission denied errors”,/var/ct/cfg/ct_has.thl文件中保存着授权主机列表,列表虽然不是加密保存,但也不是可显示的明文。另外两个文件/var/ct/cfg/ctrmc.acls和/var/ct/cfg/ctsec.nodeinfo中也有额外的一些信息,都是明文。他们都与授权有关,thl文件中保存节点信息,即包括自身,又包括管理者,HMC被设置为省缺的管理节点,安装AIX后系统会自动将HMC相关授权保存在配置文件中。通过命令/usr/sbin/rsct/bin/ctsthl -l可以显示详细内容;acls文件中保存授权的操作。
如果以上文件中一个或者多个出现错误,则会导致RSCT管理功能失败,包括HMC无法进行动态DLpar操作。/usr/sbin/rsct/install/bin/recfgct可以重新初始化授权文件。由于很多IBM的系统都基于RSCT的配置,所以重新初始化RSCT会影响到这些软件,例如GPFS、HACMP等等,所以在执行类似操作时,最好将GPFS/PowerHA/HACMP等软件停下