关于Oracle 12c的集群监控(CHM)

    正常情况下,我们有很多工具来监控oracle集群,但是Oracle更建议使用OEM来监视Oracle集群的日常运维工作,使用Cluster Health Monitor (CHM)来监控完整的技术架构,包括操作系统的监控,为确保整个oracle集群健康运行。在默认情况下,oracle强烈建议启用这两种工具,比使用他们。

    关于CHM,是12c新引入的,本文主要讲述CHM对集群的监控。

    Cluster Health Monitor (CHM)实时检测和分析操作系统和集群资源相关问题和故障,这些信息会存储在Oracle的网格基础架构管理信息库里面(关于Oracle Grid Infrastructure Management Repository database后面会介绍),可以事后分析问题,或者寻求Oracle Support支持的时候,提供这些信息。

    下面详细说明CHM相关信息:

1  CHM服务

    CHM包括以下三个服务:

1、System Monitor Service

2、Cluster Logger Service

3、Oracle Grid Infrastructure Management Repository

 

1.1系统监视服务(System Monitor Service)

    在集群的每个节点上都存在一个系统监视服务,该系统监控服务(osysmond)实时的监控和收集集群信息和操作系统相关各项指标,并把这些信息发送给集群日志服务(Cluster Logger Service),然后由集群日志服务把采集到的信息存储到网格基础架构管理信息库(Oracle Grid Infrastructure Management Repository database)里面去

        

1.2集群日志服务(Cluster Logger Service)

    在一个集群里面,每32个节点会存在一个集群日志服务cluster logger service (OLOGGERD),每多32节点会多产生一个OLOGGERD(可以是hub或者leaf节点),如果该服务失败(因为一个该服务进程同时只能运行在集群中的一个节点上,有可能该节点故障),则oracle会在其他正常的节点上启动一个OLOGGERD进程服务。由该服务来管理网格基础架构管理信息库(Oracle Grid Infrastructure Management Repository database)。

 

1.3网格基础架构管理信息库(Oracle Grid Infrastructure Management Repository database)

    关于网格基础架构管理信息库的相关说明和描述如下:
    1、它是一个用来存储集群和操作系统实时监控指标的数据库,可以通过在安装或者升级到12c的过程中来配置他,在12.1.0.1版本中,是一个可选项,但是在12.1.0.2以后的版本中,变成了默认的,必选项。
    2、
该数据库实例在集群的其中一个上运行,在节点故障的时候,能切换到集群中的其他节点继续运行,可以理解为该实例在整个集群中是以HA的模式存在。
    3、
任何集群内部服务(例如OLOGGERDOCLUMON)都是同步private网络通讯,网格基础架构管理信息库同外部客户端连接只能通过public网络。
    4、
网格基础架构管理信息库是一个数据库,那么就存在数据文件,这些数据文件默认放在ocrvoting一起的asm磁盘组中。
    5、
该数据库默认装完grid后既存在,默认数据库名mgmtdb,可以类似于普通数据库去管理,启停,查看状态等等,但是在当前情况下一般不需要单独为该数据进行备份,查看状态如下


$ crsctl stat res –t

……

ora.mgmtdb

      1        ONLINE  ONLINE       node1                    Open,STABLE

……

 

2  采集CHM数据

    进行诊断信息数据采集要确保cluster logger service必须是运行状态
    1、 运行以下命令确认cluster logger service是否运行以及运行在哪个节点下

$ Grid_home/bin/oclumon manage -get master

例如:

$oclumon manage -get master

Master = node1

    2、需要有特权账号,一般root,在一个新的目录下,运行以下命令收集相关信息,该命令可以在集群的任意一个节点下执行


# Grid_home/bin/diagcollection.pl --collect

例如:

[root@node2 chm]# /u01/app/12.1.0.2/grid/bin/diagcollection.pl --collect
Production Copyright 2004, 2010, Oracle.  All rights reserved
Cluster Ready Services (CRS) diagnostic collection tool
ORACLE_BASE is /u01/app/grid
The following CRS diagnostic archives will be created in the local directory.
crsData_node2_20150705_1320.tar.gz -> logs,traces and cores from CRS home. Note: core files will be packaged only with the --core option. 
baseData_node2_20150705_1320.tar.gz -> logs,traces and cores from Oracle Base. Note: core files will be packaged only with the --core option. 
ocrData_node2_20150705_1320.tar.gz -> ocrdump, ocrcheck etc 
coreData_node2_20150705_1320.tar.gz -> contents of CRS core files in text format
 
osData_node2_20150705_1320.tar.gz -> logs from Operating System
lsInventory_node2_20150705_1320 ->Opatch lsinventory details
Collecting crs data
Collecting Oracle base data
Collecting OCR data 
Collecting information from core files
No corefiles found 
Collecting lsinventory details
The following diagnostic archives will be created in the local directory.
acfsData_node2_20150705_1320.tar.gz -> logs from acfs log.
Collecting acfs data
Collecting OS logs
Collecting sysconfig data

会在当前目录下生成类似以下文件:

acfsData_node2_20150705_1320.tar.gz  crsData_node2_20150705_1320.tar.gz  ocrData_node2_20150705_1320.tar.gz  sysconfig_node2_20150705_1320.txt
baseData_node2_20150705_1320.tar.gz  lsInventory_node2_20150705_1320     osData_node2_20150705_1320.tar.gz

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/27802288/viewspace-1723430/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/27802288/viewspace-1723430/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值