【text2sql】新模型架构RESDSQL取得了SOTA效果

最新推荐文章于 2025-02-15 20:34:13 发布

刘承卓

最新推荐文章于 2025-02-15 20:34:13 发布

阅读量1.2k

点赞数 17

分类专栏： LLM+RAG 文章标签： chatgpt AIGC gpt prompt 语言模型自然语言处理

本文链接：https://blog.csdn.net/m0_46686599/article/details/142792611

版权

LLM+RAG 专栏收录该内容

23 篇文章

订阅专栏

这篇论文的标题是《RESDSQL: Decoupling Schema Linking and Skeleton Parsing for Text-to-SQL》，作者是来自中国人民大学信息学院，发表于2023年的AAAI。论文的主要贡献在于提出了RESDSQL框架，该框架通过解耦模式链接和骨架解析来提高Text-to-SQL任务的性能和鲁棒性。作者通过在Spider数据集上的实验验证了他们的方法，当时取得了SOTA效果。

模型概述

作者将Text-to-SQL任务视为一个翻译任务，可以使用编码器-解码器(transformer)模型来解决。为了应对现有的挑战，他们通过在输入序列中注入最相关的模式项，以及在输出序列中加入SQL骨架，从而提出了排名增强的编码器(Ranking-enhanced Encoder)和骨架感知的解码器(Skeleton-aware Decoder)。
在这里插入图片描述

排名增强编码器(Ranking-Enhanced Encoder)

目的：减少编码器输入中的所有模式项，只考虑最相关的模式项。
方法：设计了一个交叉编码器来同时对表格和列进行分类，并基于分类概率对它们进行排名。
输入：将数据库的模式项序列化成默认顺序的模式序列，并与问题拼接形成输入序列。
编码模块(Encoding Module)：使用RoBERTa模型对输入序列进行编码，并通过池化模块将每个模式项的输出嵌入表示为一个整体。
列增强层(Column-Enhanced Layer)：为了解决某些问题只提及列名而不提及表名的问题，提出了列增强层来将列信息注入到相应的表嵌入中。
交叉编码器的损失函数(Loss Function of Cross-Encoder)：使用焦点损失(focal loss)来解决训练数据中标签分布高度不平衡的问题。

骨架感知解码器(Skeleton-Aware Decoder)

目的：将SQL生成分解为两个步骤：(1) 基于问题语义生成SQL骨架；(2) 从输入序列中选择所需的“数据”（即表、列和值）来填充骨架的插槽。
方法：不直接生成目标SQL查询，而是鼓励解码器先生成SQL查询的骨架，然后继续生成SQL查询。
损失函数：使用序列生成的损失函数，基于Transformer解码器的自注意力机制，先生成骨架，然后生成SQL查询。