达梦数据库运维使用与巡检参考

概要

达梦数据库运维使用与巡检参考

整体架构流程

在国产数据库达梦数据库使用过程中,项目中后期的运维与巡检是重要的一部分技术工作内容,为保障数据库环境和数据文件内容的完整性,数据库服务器的正常状态,数据库环境优化效果等,需要进行运维巡检工作。本文旨在整理达梦数据库的运维工作概要,以常见的双机热备集群为例,可以作为运维巡检工作的参考。

技术名词解释

达梦双机热备集群:两台服务器组成的热备集群,由主机+备机+监视器的结构组成
主机:可写可读节点,负责完成写入和备份等工作
备机:热备服务器,随机承担部分查询工作,作为故障切换的备用服务器
监视器:负责检测数据库主备机状态,启动后服务名称可以用dmmonitor来查看
数据库服务:以dmserver为名的线程,负责数据库服务
数据守护:以dmwatcher为名的线程,负责进行数据同步工作

达梦数据库运维巡检主要内容

一、基本状态类

服务器限制检查:首先确认服务器在安装数据库之前是否进行了参数优化,可以通过ulimit -a 来查看数据库用户下的情况(需要先登陆 su - dmdba)
/etc/systemd/system.conf文件中的如下三个参数
DefaultLimitCORE=infinity
DefaultLimitNOFILE=100000
DefaultLimitNPROC=100000
修改用户资源限制
echo ‘dmdba soft nofile 65536’ >>/etc/security/limits.conf
echo ‘dmdba hard nofile 65536’ >>/etc/security/limits.conf
echo ‘dmdba soft nproc 10240’ >>/etc/security/limits.conf
echo ‘dmdba hard nproc 10240’ >>/etc/security/limits.conf
echo ‘dmdba soft core unlimited’ >>/etc/security/limits.conf
echo ‘dmdba hard core unlimited’ >>/etc/security/limits.conf

1.1 服务器内存使用
在各服务器上打开终端,执行free -g进行查看,内存使用超过90%需要注意,可能需要增加资源或者释放内存。
在这里插入图片描述

1.2 服务器CPU使用
在各服务器上打开终端,执行top,查看dmserver进程占用cpu情况。CPU使用率超过80%需要注意,可能需要增加资源或者进行优化。
在这里插入图片描述

1.3 磁盘空间使用
在各服务器上打开终端,执行df -h /对应路径 进行查看,磁盘空间使用超过80%,需要增加磁盘资源或者进行清理。清理操作谨慎使用
在这里插入图片描述
查看数据库文件的大小可以在数据库文件路径下执行du -sh *.DBF来看各个表空间占用大小

二、运行状态类
2.1 查看数据库服务状态
在各服务器上打开终端,执行 ps -ef |grep dmserver,服务状态异常或者不存在,需要重启数据库服务,正常状态见下图
在这里插入图片描述
2.2 查看数据库实例日志
在各服务器上打开终端,执行:
#cat dm_DM1_202301.log | grep ERR
#cat dm_DM1_202301.log | grep FA
在这里插入图片描述
在这里插入图片描述

2.3 查看数据库守护进程日志
在各服务器上打开终端,执行:
#cat dmwatcher_DM1_202301.log | grep ERR
#cat dmwatcher_DM1_202301.log | grep WARN
在这里插入图片描述

三、集群状态
3.1 集群状态查看
在各服务器上打开终端,通过tail -100f dmmonitor_20230101.log类似命令查看确认监视器日志,文件日期为最新时间,这里是通过日志运行情况查看是否在正常更新最新信息
在这里插入图片描述
查看主备WCTLSTAT值为VALID、WSTATUS值为OPEN、INST_OK值为OK、ISTATUS值为OPEN、RSTAT值为VALID,需注意上述参数值主备两节点间都需一致;查看主备FLSN值是否均在变化,且差异是否过大,差值过大且刷新没有变化,则确认异常

3.2 数据库集群状态运行检查
在各服务器上打开终端,通过ps -ef |grep dmwatcher查看数据库的数据守护是否运行正常,查询情况与dmserver的类似
3.3 数据库备份定时任务执行情况检查
打开数据库管理工具:manager管理工具-【代理】-【作业】-【备份任务】-右键选择【查看作业历史信息】查看这周的全量备份和增量备份情况,见下图
在这里插入图片描述
如果出现备份失败,则说明备份空间不足或者备份进程异常

四、应特别需要注意的事项
4.1 操作注意事项
不要在生产环境操作所有rm -rf类删除操作,如果有需要变更的内容,建议先备份。
不要在生产环境新建测试实例或执行较大占用的进程,避免影响使用。

五、常规操作
5.1 登录
数据库管理工具登陆:在有数据库客户端的服务器上,在终端里执行:
cd /opt/dmdbms/bin/tool
./manager
则可以开启数据库管理工具,进行操作。
5.2 重置
新建数据库实例:在数据库服务器的终端执行:
cd /opt/dmdbms/bin/bin
./dminit help,根据需求确认参数并创建。

小结

通过对数据库服务器和数据库集群本身的巡检,确认使用状态和使用进展,可以进一步对未来的数据库服务器使用进行预期,如是否需要增加资源,在较长时间段后是否需要加硬盘扩容等等。通过对日志的巡查也可以看到是否出现过其他问题,如网络波动,数据库内sql执行报错或者运行时间异常等,对项目的状态有整体的把控。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值