报告主题:从智能运维体到结构化数据学习,基于大模型数据库诊断系统D-Bot
报告日期:09月05日(周四)10:30-11:30
报告要点:
数据库管理员(DBA)在管理、维护和优化数据库系统方面扮演着重要的角色。然而,对于DBA来说,管理大量数据库并及时响应是困难和繁琐的(在许多在线情况下等待几个小时是不可容忍的)。此外,现有的经验方法只支持有限的诊断场景,而且更新数据库版本的诊断规则也需要耗费大量的人力。最近,大型语言模型(LLM)在各个领域展现了巨大的潜力。因此,我们提出了D-Bot,一种基于LLM的数据库诊断系统,可以从诊断文档中自动获取知识,并在可接受的时间范围内生成合理和有根据的诊断报告(即确定根本原因和解决方案),例如与DBA相比,D-Bot可以在10分钟内完成,而DBA可能需要数小时。D-Bot中的技术包括(i)从文档中提取离线知识,(ii)生成自动提示(例如知识匹配、工具检索),(iii)使用树搜索算法进行根本原因分析,以及(iv)用于具有多个根本原因的复杂异常的协作机制。我们在真实基准测试中验证了D-Bot(包括六个典型应用程序的539个异常),结果表明D-Bot可以有效地分析未见异常的根本原因,并显著优于传统方法和像GPT-4这样的基础模型。
报告嘉宾:
周煊赫,研究领域为intelligent database system、data-centric AI。他于2024年在清华大学获得博士学位,导师为李国良教授。他在SIGMOD、VLDB等CCF A类数据库会议和期刊上已发表论文30余篇,其中第一作者长文8篇(含2019-2023两篇VLDB、ICDE高被引论文;入选CMU、Cornell课程),谷歌学术引用量破千次。博士学位论文获得清华优秀博士学位论文。相关研究成果曾获顶会VLDB最佳工业论文提名奖(第一作者)、清华特等奖学金、微软学者(亚太12人)、字节跳动奖学金(中国10人)、北京市优秀毕业生、Benchcouncil Top100开源成就等荣誉。
扫码报名