如何将图数据库应用于企业智能运维

文章探讨了智能运维(AIOps)在应对复杂数据和网络环境中的挑战,强调了建立智能运维图谱的重要性。通过使用Galaxybase图数据库,可以创建设备和系统的动态关系模型,实现故障定位和影响分析的高效执行。举例说明了如何通过图数据库查询来定位站点故障和分析设备故障的影响范围,展示图数据库在智能运维中的应用价值。
摘要由CSDN通过智能技术生成

导读

随着数字化转型的加剧,数据资源的规模及复杂度也呈指数级增长,同时在不断扩大的网络规模和虚拟化趋势的推动下,运维发展也从CMDB的自动化阶段朝着智能运维阶段过渡。智能运维(AIOps)阶段是最理想化、最高效的运维方式,其将大数据、人工智能等技术融入运维领域,实现智能故障预测、故障定位、故障自愈等。

但在实际场景中,AIOps却存在广泛痛点导致目标无法高效实行。例如金融行业,运维系统影响业务系统,造成业务处理周期长,使大量客户流失。解决其落地的关键在于智能运维图谱的建立,智能运维图谱位于运维数据中台内,管理对象层存储有静态数据,各对象调用时产生数据依赖关系、动态数据,各对象数据更新时产生流程数据。系统运行时,图谱将调用下游接口,对数据进行整合和关系提取,从而构建多层次的运维关系网络,并针对不同的服务场景产出不同的关联关系图谱,从而实现对场景中各类服务的能力支持。

基于此背景,运维人员需要将运维对象的动态关系(服务调用关系、设备网络关系、作业依赖关系)和静态运行状态(数据库运行状态、应用运行状态、服务器运行状态)数据关联起来,构建全局视角下的智能运维图谱,从而保障企业服务正常运行。

以Galaxybase图数据库进行运维管理的方法原理图如下。

以Galaxybase图数据库进行运维管理的方法原理

创建模型

构建设备网络之间的关联关系,可以根据运维对象的实际情况展开,将物理实体、虚拟化设备、网络应用设置为点,各实体间调度关系设置为边。接下来使用Galaxybase图数据库来创建数据模型,点类型和点属性如下表所示。

点类型属性
设备虚拟机WebVM编号
存储区域网络SAN编号
站点站点编号、URL
服务器服务器编号
数据库虚拟机DBVM编号
客户管理系统管理系统编号

边类型、起始点类型、终止点类型如下表所示。

边类型起始点类型终止点类型
调度站点设备虚拟机
调度站点数据库虚拟机
调度设备虚拟机服务器
调度服务器服务器
调度服务器储存区域网络
调度数据库虚拟机服务器
调度客户管理系统数据库虚拟机

智能运维图谱模型如下图所示。

智能运维图谱模型

智能运维 - 故障定位

在运维管理中,运维人员发现某个站点无法显示网页信息,需要排查站点背后服务器、数据库等设备间的调度关系,定位故障所在。举例,在上文所建图模型中,我们将寻找“站点02”无法显示的问题可能出现在哪里,查询的流程图如下所示。

故障定位查询流程图

查询语句

// 以P代指路径,查询站点“URL02”4度网络内所有调度关系
MATCH p = (n:站点{站点编号:'URL02'})-[r*1..4]->(m)
// 返回路径p,在画布查看站点“URL02”4度网络内所有调度关系
RETURN p

查询结果

如下图所示,画布显示站点“URL02”背后所有的设备调度关系,包括数据库虚拟机“DBVM04”、设备虚拟机“WEBVM02”、服务器“SERVER02”及储存区域网络“SAN01”等,在站点“URL02”的故障关系网内,运维人员对可能存在故障的设备进行逐一排查,精确定位故障所在。

故障定位查询结果图

智能运维 - 影响分析

在运维管理中,设备间的调度关系十分复杂,我们对设备资产进行优化时,需要快速追溯基础架构内所有设备和关系,依此进行影响分析,确定优化方案。举例,在上文所建图模型中,我们将分析服务器“Server05”故障带来的影响范围,查询的流程图如下所示。

影响分析查询流程图

查询语句

// 以p代指路径,查询依赖于服务器“Server05”的所有设备信息
MATCH p=(n3:存储区域网络)<-[r3]-(n2:服务器{服务器编号:"Server05"})<-[r2]-(n:服务器)<-[r]-(m)<-[r1]-(n1:站点) 
WITH p,m
// 找到设备信息后,查询受影响的数据库虚拟机和客户管理系统
OPTIONAL MATCH q=(m)<-[r4]-(n4:客户管理系统) 
// 返回服务器“Server05”出现故障后,受影响的关系网络
RETURN p,q

查询结果

如下图所示,可以看到和“服务器05”存在调度关系的的所有服务器、设备虚拟机、数据库虚拟机、站点和客户管理系统,如“服务器05”、站点“URL02”、客户管理系统“CRM01”等。当“服务器05”出现故障时,这些服务也可能会受到相应的影响,运维人员应对这些服务进行重点关注。

 

 结语

以上仅为智能运维图谱的简单展示,通过上述两个例子,可以看到图数据库能够抽取下游数据,将应用服务、基础设施、批次作业等之间的依赖关系以全局统一视角进行整合,打破运维人员之间的信息茧房问题,实现跨应用的精准故障定位和业务影响范围分析,实现智能运维。

后续,我们会在创邻科技微信公众号发布更多图数据库热点应用场景和前沿资讯,欢迎对图数据库感兴趣的同学关注。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值