GaussDB 智能问答和运维智能体GaussDB运维智能体

GaussDB 智能问答和运维智能体GaussDB运维智能体

在运维阶段,我们同样积极探索将已有的智能运维工具以及当前的大模型技术相结合,建立更加智能化、自治化的数据库故障分析与自愈框架。

在这里插入图片描述

GaussDB故障运维智能体

如图3所示,GaussDB当前的故障运维智能体框架,主要依托大模型的多步对话、规划、反思以及工具调用的能力,形成能够自治并完成复杂故障分析任务的智能体应用。

GaussDB以LLM为决策大脑,按照案例知识召回、故障分析计划编排、故障分析执行、故障根因总结等步骤,结合运维工具集进行工作,其工作流程如图4所示。

在这里插入图片描述

故障运维智能体工作流程

工具能力构建

GaussDB当前通过AI算法构建了系列异常检测、慢SQL诊断、集群故障根因诊断等关键运维能力。通过restful/Dubbo 接口与智能体无缝对接,确保了高效的数据交互与调用。通过构建运维工具API集合,在智能体分析故障流程中,实现不同故障运维场景下大模型能够调用合适的工具。

运维案例记忆

通过资深运维专家总结标准作业流程SOP,记录特定故障场景下需要检测的事项信息步骤以及故障判断准则,为智能体引入专家经验,构建故障运维案例库。此部分知识可以储存在数据库当中,留待智能体检索使用,而且在实践过程中,会对现网运维常见的CPU使用率、长事务、集群状态等TOP场景优先进行了支持。

故障分析计划编排

根据故障现象,通过相似度搜索,故障智能体在运维案例记忆中召回相关运维案例,组装成提示词,输入到大模型进行分析流程编排。对于不在预设TOP场景的故障类型,则通过大模型会根据现有案例以及运维知识,推理生成规划,形成对未知故障的学习能力。

故障分析执行

在计划编排步骤得到的故障分析计划下,重新组装提示词输入到大模型进行工具调用执行的任务,可以利用LLM的工具调用Function call能力,从工具集当中选择各个步骤的所需的工具参数,以及对应的工具接口API,生成的结果可以通过restful/Dubbo等接口协议进行执行,并且获取接口调用结果。对于需要多步执行的流程,上一步接口调用的结果,有可能需要拼接到LLM的下一步输入。

故障定位总结与报告生成

经过完整的计划编排以及分析执行后,这些步骤的结果将会汇总输入到LLM输出根因定位总结报告。在用户界面上,展示完整的分析流程以及对应的根因定位总结报告。

通过以上流程,运维智能体可以减少运维人员分析故障的复杂度,节省故障定位时间,同时能够直观展示分析流程以及总结报告。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值