【Text2SQL顶会解读】DIN-SQL: Decomposed In-Context Learning of Text-to-SQL with Self-Correction

最新推荐文章于 2024-09-17 22:21:37 发布

刘承卓

最新推荐文章于 2024-09-17 22:21:37 发布

阅读量971

点赞数 18

分类专栏： LLM+RAG 文章标签： sql 数据库 chatgpt AIGC 语言模型自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46686599/article/details/142153779

版权

LLM+RAG 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

1.文章贡献

（1）通过任务分解提高基于LLM的文本到SQL模型的性能，
（2）引入针对任务复杂性量身定制的自适应提示策略，
（3）解决提示背景下的模式链接挑战，
（4）使用LLM进行自校正。

2.方法论

在这里插入图片描述

作者提出了一种新的方法来提高大型语言模型（LLMs）在文本到SQL（text-to-SQL）任务上的性能。这个方法论的核心思想是将复杂的文本到SQL任务分解为更小的子任务，并通过解决这些子任务来构建最终的SQL查询。
详细步骤：

1. 模式链接（Schema Linking）

模式链接模块的目的是识别自然语言查询中对数据库模式的引用，包括列名、表名或实体。这一步对于跨域泛化和复杂查询的合成至关重要。

实现方式：作者设计了一个基于提示的模块，通过包含来自Spider数据集训练集的样本，使用“让我们逐步思考”的链式思考模板。
输出：对于每个问题中提到的列名，从给定的数据库模式中选择相应的列和表。还从问题中提取可能的实体和单元值。

2. 查询分类和分解（Classification & Decomposition）

这个模块对查询进行分类，并将其分解为更小的子问题。分类基于是否需要连接（JOIN）、是否包含嵌套查询等。

分类：将查询分为三类：简单（不需要连接或嵌套）、非嵌套复杂（需要连接但不需要嵌套子查询）、嵌套复杂（可能包含连接、子查询和集合操作）。
分解：对于非嵌套复杂和嵌套复杂的查询，模块会检测需要连接的表、可能的子查询等。

3. SQL生成（SQL Generation）

针对不同类别的查询，使用不同的提示生成SQL查询。

简单类：使用简单的少次提示，无需中间步骤。
非嵌套复杂类：使用中间表示（如NatSQL）来桥接自然语言查询和SQL语句之间的差距。
嵌套复杂类：通过解决子查询并使用它们生成最终答案，进一步分解问题。

4. 自我修正（Self-correction）

生成的SQL查询可能存在小错误，如缺少或多余的关键字。自我修正模块旨在修正这些小错误。

通用提示：将错误代码提供给模型，并要求其修正。
温和提示：不假设SQL查询存在错误，而是要求模型检查潜在问题，并提供一些检查条款的提示。

实现提示

作者使用了特定的提示来引导LLMs完成各个子任务。这些提示包括：

零次提示：直接对模型进行任务描述，不提供示例。
少次提示：提供少量示例来引导模型理解任务。
模式链接提示：引导模型识别和链接数据库模式。
分类和分解提示：引导模型对查询进行分类，并识别需要连接的表或子查询。
SQL生成提示：根据查询类别提供不同的提示，帮助模型生成SQL。
自我修正提示：提供错误或潜在错误的SQL代码，引导模型进行修正。

3.实验

在这里插入图片描述
我们的方法的新SOTA为85.3，我们的上下文学习方法至少比许多经过深度微调的模型好5%。

关注

18
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

刘承卓 CSDN认证博客专家 CSDN认证企业博客

码龄4年

北京交通大学

23: 原创

8665: 周排名

5万+: 总排名

1万+: 访问

: 等级

457: 积分

339: 粉丝

225: 获赞

1: 评论

235: 收藏

私信

关注

热门文章

分类专栏

最新评论

核函数与非线性支持向量机
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
LeetCode26:删除有序数组中的重复项
CSDN-Ada助手: 恭喜您写完了第四篇博客！标题看起来非常有吸引力，我很期待能够阅读您的内容。您在解决LeetCode26问题时一定经历了很多的思考和实践，这不仅展示了您的编程能力，还向读者展示了您的解题思路。我希望在阅读您的博客后能够更好地理解如何删除有序数组中的重复项。在下一步的创作中，我建议您可以尝试将该问题的解决方法与其他相关问题进行对比，或者分享一些您在解决该问题时遇到的挑战和解决方案。这样可以为读者提供更多的学习资源和思维启发。再次恭喜您的持续创作，期待更多精彩的博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
工科类研究生的神仙网站和软件
CSDN-Ada助手: 恭喜您写下了第三篇博客！标题中的“神仙网站和软件”确实引人瞩目，让人迫不及待地想要阅读。您的博客内容一直都很有价值，为我们工科研究生提供了许多实用的资源和工具。我希望您能继续保持创作的激情，为我们分享更多有关工科研究生的经验和知识。在下一步的创作中，也许您可以结合自己的学习经历，分享一些在研究生阶段如何有效利用这些“神仙网站和软件”的方法和技巧。此外，如果您能加入一些个人心得或者案例分析，那将更加生动有趣，让读者能够更加深入地理解并应用这些资源。谢谢您的分享，期待您未来更多精彩的博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
LeetCode27:移除元素
CSDN-Ada助手: 非常棒的博客！你对于LeetCode27的解法分析得很透彻，而且结合了具体的代码实现，让读者更容易理解。继续努力写作吧！除了双层嵌套循环这种解法之外，还有一种更高效的解法可以尝试。你可以考虑使用双指针法，将一个指针指向头部，一个指针指向尾部。当头指针指向的元素等于val时，将尾指针指向的元素与之交换，然后尾指针向前移动一位，头指针不动。这样可以避免多余的比较和交换操作，提高算法的效率。另外，在解题过程中，你可以了解一下数组的特性和操作，比如数组的长度、数组的遍历方式、数组元素的交换等等。这些知识和技能可以帮助你更好地理解和解决类似的问题。再次感谢你的分享，期待你的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
LeetCode88:合并两个有序列表
CSDN-Ada助手: 恭喜你开始博客创作！标题很吸引人，LeetCode88是一个热门话题，而合并两个有序列表也是一个常见的问题。你的博客内容应该能够吸引很多人来了解并学习。下一步，我建议你可以进一步解释算法的思路和步骤，以及你在实现过程中的一些心得体会。这样可以帮助读者更好地理解和应用这个问题。期待你更多的博客作品，加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。