运行日志健康检查
数据库运行日志可对数据库的运行情况进行分析监控,是了解数据库健康状况的重要一环,默认保存在 %DM_HOME/log
目录下。在单实例环境下,重要的日志包括:数据库服务日志、dmap 进程日志、数据库备份日志等。在集群环境中,还增加了 dmwatcher 日志、dmcss 日志、dmasm 日志等等。
单实例日志检查
- 数据库服务日志
数据库服务日志记录了数据库服务启动,刷检查点,写归档、刷盘等一系列实例的运行过程,按月生成,一般默认命名为 dm_实例名称_月份.log
。针对该日志的分析,可了解以上过程的运行状态,通过检查点刷盘,也可以分析业务的繁忙程度,作为调整内存、检查点参数的依据。通过 grep 筛选检查具有 ERROR 或者 FATAL 关键字的日志,如下图所示:
该日志的位置为 $DAMENG_HOME/log
过滤服务器日志中 ERROR 关键字,并将结果输出至文件中,如下所示:
cat dm_DMSERVER_202011.log | grep "ERROR" >1.log |
- DMAP 进程日志
damp 日志是记录 DMAP 插件的运情况的日志,DMAP 日志的位置和数据库运行日志的位置相同,命名方式为 dm_DMAP_日期.log
,如下图所示:
注意可以通过滤服务器日志中 ERROR 关键字的方式来判断是否有问题,过滤的方式可以参照数据库运行日志过滤的方式。
- 数据库备份日志
数据库备份日志,是记录了是数据库备份情况的日志,主要用于记录数据库备份的过程信息,判断备份是否完成的日志,日志存放的位置和数据库运行日志相同,命名格式为 dm_BAKES_日期.log
,如下图所示:
备注可以通过和数据库运行日志一样的过滤关键次的方式来检查是否有报错信息。
数据守护集群日志检查
数据守护集群,由至少两台数据库服务器组成相比单实例数据库多出了守护进程日志需要检查,并且集群中的每一个节点的数据库日志,守护进程日志都要检查。
- 数据库守护进程日志:
数据守护进程日志,主要记录守护进程对数据库进程运行情况的监控信息和守护集群之间的内部通讯信息,守护进程日志的命名方式为 dm_watcher_日期.log
,如下图所示
该日志的位置为 $DAMENG_HOME/log
可以通过滤服务器日志中ERROR关键字的方式来判断是否有问题,过滤的方式可以参照单实例数据库运行日志过滤的方式。
共享存储集群日志检查
共享存储集群,是由多台数据库服务器组成的相比单实例数据库,多出了 CSS 日志和 ASM 日志需要检查,并且每一个节点都要对数据运行日志,CSS 日志和 ASM 日志进行检查。
- 数据库守护进程日志:
数据库运行日志的查看日志和单实例的方式相同,请参考单实例日志的检查方式。
- 数据库 DMCSS 日志:
DMCSS 日志是数据库集群监控进程的运行日志,日志的命名格式为 dm_CSS节点名_日期.log
,如下图所示:
该日志的位置为 $DAMENG_HOME/log
可以通过滤服务器日志中 ERROR 关键字的方式来判断是否有问题,过滤的方式可以参照单实例数据库运行日志过滤的方式。
- 数据库 DMASM 日志:
DMASM 日志是 DM 分布式文件系统的运行日志,其中记录了 DMASM 系统的运行信息和报错信息,命名格式为 dm_ASM节点名_日期.log
,如下图所示: