LMON主要借助两种心跳机制完成健康检查:
1)节点之间网络心跳,可以简单理解为节点间定时发送ping包检测节点状态,如果规定时间能收到回应,就认为对方状态正常
2)通过控制文件磁盘心跳,每个节点的ckpt进程每3秒更新一次controlfile的数据快,由于controlfile是共享的,所以实例之间可以检查对方是否及时更新controlfile来判断对方的状态。
5、DIAG: Diagnostic Capture Process。
用来打印诊断信息。diag进程会响应别的进程发出的dump请求,将相关的诊断信息写到diag trace文件中。在RAC上,当发出global oradebug请求时,会由每个实例的diag进程来打印诊断信息到diag trace中。
比如:下面的命令用了“-g”,那么生成的dump信息会分别写到每个实例的diag trace文件中:
SQL>oradebug -g all hanganalyze 3
SQL>oradebug -g all dump systemstate 266
6、ASMB: ASM Background Process。
用于和ASM实例进行通讯,用来管理storage和提供statistics。当使用ASMCMD的cp命令时,需要用到ASM实例上的ASMB进程,数据库实例的spfile如果位于存于ASM上,那么也会用到ASMB进程。如果OCR存放在ASM中,也会用到ASMB。
7、RBAL:ASM Rebalance Master Process。
作为ASM磁盘组进行rebalance时的协调者(Coordinator)。在数据库实例上,由它来管理ASM磁盘组。