openGauss数据库源码解析——慢SQL检测

最新推荐文章于 2024-08-28 11:34:01 发布

scp091

最新推荐文章于 2024-08-28 11:34:01 发布

阅读量1.9k

点赞数

文章标签： ai 数据库神经网络深度学习

本文链接：https://blog.csdn.net/scp091/article/details/121745007

版权

本文详细介绍了openGauss数据库的慢SQL检测功能，包括基于执行计划的DNN模型和MART模型，以及基于SQL模板化的预测流程。讨论了各种方法的优缺点，如DNN模型预测慢、环境变化影响准确性，MART模型泛用性不足，以及SQL模板化的流程和预测策略。文章还提到了深度学习在SQL执行时间预测中的应用。

摘要由CSDN通过智能技术生成

openGauss数据库源码解析——慢SQL检测

慢SQL检测的定义：

基于历史SQL语句信息进行模型训练，并用训练好的模型进行SQL语句的预测，利用预测结果判断该SQL语句是否是潜在的慢SQL。当发现潜在的慢SQL后，开发者便可以进行针对性优化或者风险评估，以防业务上线后发生问题。

慢SQL检测的功能：

上线业务预检测：上线一批新业务前，使用SQL诊断功能评估此次上线业务的预估执行时长，便于用户参考是否应该修改上线业务。workload分析：能够对现有workload进行分析，将现有workload自动分为若干类别，并依次分析此类别SQL语句执行代价，以及各个类别之间的相似程度。

首先，明确一下慢SQL发现的几个不同阶段，及其对应解决的问题。

阶段1：对用户输入的一批业务SQL语句进行分析，推断SQL语句执行时间的快慢，进而可以将评估为慢SQL的语句识别出来。

阶段2：对识别出的潜在慢SQL进行根因诊断，判断这些SQL语句是因为什么慢，例如比较常见的原因可能是数据量过大、SQL语句自身过于复杂、容易产生并发的锁冲突、没有创建索引导致全表扫描等等。

阶段3：对于已经识别出来的慢SQL语句的可能问题源，给出针对性的解决方案，譬如可以提示用户进行SQL语句的改写、创建索引等。

目前openGauss已具备阶段1的能力，正在推进阶段2能力，同时发布了部分阶段3的能力，如索引推荐功能。业内对于上述第一阶段的主要实现方法大部分是通过执行计划进行估计的，第二阶段大多是通过构建故障模式库、通过启发式规则来实现的，有了上述前两个阶段的准备，第三阶段的实现往往是比较独立的。学术界对于第一阶段的研究比较多，第二阶段采用常规的构建故障模式库的方法实现已经能取得比较好的效果了，因此并不是研究的热点，而第三阶段的工作又相对独立，可以单独作为一个领域进行研究。

基于执行计划的DNN模型：