一. 前言
1.1 背景
本文是根据Text2SQL任务做的业务延伸,主要是在给某客户公司完成相关开发需求时遇到的具体业务问题进行的总结,并针对业务问题进行的优化。Agent版本对比V2.0等算法优化工作多了额外的数据可视化模块,属于商业交付的业务。算法层面的优化,可以参考作者前面的几篇文章。
这里的任务是国外的客户,数据采用的甲方提供的数据,英文形式,底座模型采用的是langchain的gpt4模型。
1.2 任务描述
给定一个数据库,数据库中包含多张表,然后根据用户输入的prompt信息,生成对应的SQL语句以及描述SQL结构化信息对应的图表类型和参数K-V对。(前端UI界面由客户公司完成)。
即完整的产品链路为用户在终端界面上输入查询prompt信息,通过LLM生成对应的SQL,完成SQL查询操作,然后根据该结果由LLM决策用什么形式展示查询结果,并生成对应的参数信息K-V对,最终以图表的形式在终端上进行响应,提升交互体验。
本期项目主要支持了基于5种图表的数据可视化,分别为柱状图、折线图、表、箱图和词云,对应了5种不同场景下的数据可视化业务需求。
1.3 参考功能
二. 工作描述
本任务对比于学术界的text2SQL任务,多了三个子任务: 图表类型选择、API参数对齐和槽位对齐。本期的SQL数据可视化Agent的4个子任务(青色标识部分)由LLM推理完成, 后续可尝试end2end的模式。整体上的业务流程图可以参考:
支持的五种业务场景最终展示效果参考:
柱状图:
折线图:
表:
箱图:
词云:
三. 业务建模
3.1 Text2SQL
本期业务的目标主要是对标了DIN-SQL的业务流程,在Schema Link Extraction任务上增加了COT的优化,并根据了业务问题