1、编制目的
为了提升运维质量,增强数据库运维标准化、规范化,保障信息系统的安全、稳定、高效运行,助力实现智能运维,star同学在此抛砖引玉,特编制该文档。
2、维度定义
根据运维经验,现将数据库日常维护划分为以下四个维度“运行、隐患、优化、安全”,现对以上四个维度定义及解释如下,
运行监控: 短时间内(如1小时)影响数据库运行的指标,监控周期频繁(如5分钟/30分钟/1小时/12小时),对应日常巡检工作。
隐患排查: 非短时间内(一天/一周)影响数据库运行的指标,监控周期频率较低(如每天/每周),对应特巡特检工作。
性能优化:性能优化分为SQL审核、主机优化、Oracle实例优化三个部分,每天常态化开展,对应常态化优化工作。
安全审计:根据企业特点、行业规范进行数据库安全审计,确保系统安全运行。
3 、指标规范
为了防止巡检项缺失造成系统“异常/隐患”不能及时发现,或者巡检项“过剩、过密”造成数据库不堪重负的问题,迫切需要规范性的巡检指标,在有限的巡检指标和频率下,确保系统安全稳定运行,骤步提升系统整体性能。
运行指标,运行指标现划分为5个标准指标和5个可选指标,如下图所示(实际指标项需根据企业特点制定),
隐患指标,隐患指标现划分为10个标准指标和10个可选指标,如下图所示(实际指标项需根据企业特点制定),
性能指标,性能指标现划分SQL审核、主机、Oracle实例三个方向,如下图所示,
安全指标,安全指标需根据企业运行特点制定,示例如下,
4、技术培训
将数据库类技术培训划分为“低头、抬头、回头”三个方向, 如下图所示,
5、智能运维
智能运维方向暂划分为阈值管理、告警管理、知识库建设、技术服务提报流程、大屏展示等。
说明:本文为方法论探索文章,具体细节需根据企业特点制定,希望能对大家有所帮助和启发。(需要导图原图,请留言提供邮箱。)
6、附件、Oracle数据库智能运维标准化工艺导图