论文：DIN-SQL：Decomposed In-Context Learning of Text-to-SQL with Self-Correction

||Φ|(|T|Д|T|)|Φ||/

已于 2024-07-30 20:53:25 修改

阅读量997

点赞数 33

文章标签： sql

于 2024-07-30 20:48:37 首次发布

本文链接：https://blog.csdn.net/qq_51700285/article/details/140799392

版权

ps：才开始学习，有问题很正常，QAQ，主要是自用当笔记本

1.Introduction

在zero-shot和few-shot下的大模型已经有了足够好的结果，但这些模型在常用的基准测试（比如spider上）仍然落后于设计良好的经过微调的模型，如下图：

微调相比于从头开始或微调一个模型，不需要消耗过多的资源，此外在一些基准测试数据集上，few-shot已经展现出较好性能，在训练例子有限的情况下也能有很高准确率。最新结果表明，LLM在使用如：chain-of-thought、least-to-most、decomposed prompting techniques等技术后在更复杂的任务中的性能可以得到改善。

本文的贡献在于：

（1）通过任务分解提高了基于LLM的text-to-SQL的模型性能

（2）引入适应任务复杂性的自适应提示策略

（3）在提示上下文中解决schema links挑战

（4）使用LLM进行自修正

2.Related Work

seq-to-seq模型在text2sql任务中显示出了巨大潜力，核心思想是结合给定的自然语言问题和schema并理由解码器来预测目标的SQL。

具体的略

3.Few-shot错误分析

随机在spider数据集的训练集中的不同数据库中抽取了500个查询，来解释LLM在少数情况下的失败之处。本文手动检查了这些失败，并将其分为六种。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

||Φ|(|T|Д|T|)|Φ||/

关注关注

33
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

NL2SQL进阶系列(4)：ConvAI、DIN-SQL、C3-浙大、DAIL-SQL-阿里等16个业界开源应用实践详解[Text2SQL]

丨汀、的博客

04-13

3723

NL2SQL进阶系列(4)：ConvAI、DIN-SQL等16个业界开源应用实践详解[Text2SQL]

【Text2SQL 论文】DIN-SQL：分解任务 + 自我纠正 + in-context 让 LLM 完成 Text2SQL

VLyb

05-31

2198

本论文设计的 prompt 以及思路让 LLM 在解决 Text2SQL 任务上有了不错的表现，产生了与最先进的微调方法相当甚至更优的结果。但是，本文的思路需要多轮与 LLM 交互，从而产生了巨大的花费和延迟，论文给出，在使用 GPT4 响应 Spider 数据集中 question 时表现出大约 60s 的延迟。

参与评论您还未登录，请先登录后发表或查看评论

【Text2SQL顶会解读】DIN-SQL: Decomposed In-Context Learning of Text-to-SQL with Self-Correction

m0_46686599的博客

09-12

1366

文章贡献：（1）通过任务分解提高基于LLM的文本到SQL模型的性能，（2）引入针对任务复杂性量身定制的自适应提示策略，（3）解决提示背景下的模式链接挑战，（4）使用LLM进行自校正。

论文阅读：DIN-SQL: Decomposed In-Context Learning of Text-to-SQL withSelf-Correction

qq_42681787的博客

08-22

3765

NL2SQL是将自然语言转化为SQL的任务，该任务隶属于NLP的子任务，NL2SQL在AIGC时代之前，以seq2seq、BERT等系列的模型在NL2SQL的主流数据集上取得了不错的效果，2022年底，ChatGPT爆火，凭借LLM强大的逻辑推理、上下文学习、情景联系等特点，按理说LLM应该可以超过seq2seq、BERT等系列的模型，但是使用少样本、零样本提示方法用LLM解决NL2SQL问题效果却比不上之前的模型。今天分享的这篇来自NLP顶级会议的论文解决了这个问题：如何改进Prompt让LLM超越之前的

【论文阅读】让数据库听懂人话（Text-to-SQL）

热门推荐

梦想破三的奔三狗

12-30

1万+

论文标题: 在跨领域数据库中引入中间表示来实现复杂Text2SQL 英文标题: Towards Complex Text-to-SQL in Cross-Domain Database with Intermediate Representation 论文下载链接: https://arxiv.org/abs/1905.08205 论文项目代码: GitHub@IRNet 摘要本文提出一种名为IRNet的神经方法解决复杂的, 跨领域的(cross-domain) Text-to-SQL任务; IR

【LLM之NL2SQL】DIN-SQL论文阅读笔记

06-18

1382

研究关注于使用大型语言模型（LLMs）进行复杂的Text-to-SQL任务，目标是弥补精调模型与基于提示的方法之间的差距。早期系统依赖于特定领域或基于规则的方法，而最近的系统利用深度神经网络模型和LLMs，以提高领域独立性和效率。

【DIN-SQL】Decomposed In-Context Learning of Text-to-SQL with Self-Correction 论文阅读

lcomecon的博客

05-12

1098

DIN-SQL to solve text-to-SQL

DIN-SQL论文阅读 N2sql

xs86467的博客

07-04

795

1. 通过任务分解提高基于LLM的文本到SQL模型的性能。2. 引入针对任务复杂度的自适应提示策略。3. 在提示的背景下解决模式链接挑战。4. 使用LLM进行自我纠错。

语义解析 (Text-to-SQL) 技术研究及应用下篇

qq_40247584的博客

05-13

3641

欢迎关注“百度NLP”官方微信公众号，及时获取更多自然语言处理领域的技术干货！原文链接：https://mp.weixin.qq.com/s/5lTLW5OOuRMo2zjbzMxr_Q 在上篇中，我们结合实例向大家介绍了语义解析技术中的Text-to-SQL任务，明确了该任务的研究动机，并从相关数据集和模型两方面讲解了Text-to-SQL的技术进展。本篇，我们就数据集DuSQL的建设和模型DuParser的构建，向大家介绍百度在Text-to-SQL技术方面的研究，并展示百度在To..

语义解析 (Text-to-SQL)学习笔记1

PyIDEA

02-23

2299

组成部分 Text-to-SQL解析器和SQL执行器。目前能做到的程度 SQL查询语句是一个符合语法、有逻辑结构的序列，其构成来自三部分：数据库、问题、SQL关键词。在当前深度学习研究背景下，Text-to-SQL任务可被看作是一个类似于神经机器翻译的序列到序列的生成任务，主要采用Seq2Seq模型框架。基线Seq2Seq模型加入注意力、拷贝等机制后，在单领域数据集上可以达到80%以上的准确率，但在多领域数据集上效果很差，准确率均低于25%。从编码和解码两个方面进行原因分析。在编码阶段，问题与

DAIN-SQL，DAIL-SQL，C3-SQL和 DIN-SQL 技术的理解和异同点

annicybc的专栏

10-30

823

DAIN-SQL、DAIL-SQL 和 C3-SQL 都是与自然语言处理和数据库查询相关的研究工作，它们旨在将自然语言问题转化为相应的 SQL 查询语句。这些方法都是当前自然语言处理领域中，将自然语言问题转化为数据库查询语句的先进研究工作，它们利用了大型语言模型的强大能力，通过不同的策略和技巧来提高性能和准确性。

text2sql方法：NatSQL和DIN-SQL

beingstrong的博客

09-28

1446

text2sql方法：NatSQL和DIN-SQL思路介绍

自然语言转SQL，一个微调ChatGPT3.5的实例(下)--模型微调及模型性能

程序员成长软技能

01-04

1883

因此，在使用Spider数据集时，我们将样本数量从7000个减少到5750个，并进行总共2个时期的微调。我们将微调模型的性能与未经微调的GPT3.5-Turbo和DIN-SQL + GPT-4（Spider的当前最先进方法）进行了基准测试，以获得零-shot性能。微调的G-3.5-Turbo的性能与之前的方法相比进的提示技术，包括少量提示、思维链提示和分解提示）保持一致，这是当前最先进的方法。如上所示，与DIN-SQL与GPT-4相比，微调的GPT-3.5-Turbo模型的成本。

springboot不连接数据库启动(原先连接了mysql数据库)

uncofish的博客

04-27

181

配置application.properties。配置H2内存数据库（无需真实数据库）

使用Docker Compose定义服务依赖：构建高可用Django+PostgreSQL+Redis架构

最新发布

草药味儿の岁月

04-28

518

前言一、Compose文件核心结构解析1.1 版本选择与组件定位1.2 服务依赖的三种境界二、服务定义深度配置2.1 PostgreSQL服务（带健康检测）2.2 Redis服务（持久化配置）2.3 Django应用服务（依赖控制）三、高可用实践技巧3.1 服务启动顺序控制3.2 连接重试机制增强3.3 熔断降级策略四、灾难恢复方案4.1 数据库备份策略4.2 容器自愈配置五、完整Compose文件示例结语在微服务架构中，服务间的依赖关系如同精密钟表的齿轮，任何一个组件的异常都可能导致整个系统停摆。

SQL实战：01之行转列实现

04-24

380

我们在工作中遇到的很多场景需要将数据表中的一行的值转为一列的值，为实现这种场景可以通过IF函数或者CASE WHEN的方式来实现。恰好本人最近在刷题，就以碰到的LeetCode中的题为例子来讲解如何使用IF和 CASE WHEN 实现行转列。

MySQL索引优化、SQL分析与运行原理 - Java架构师面试实战

南客先生的博客

04-25

632

面试官：马架构，请问您对MySQL的B+树索引有什么理解？马架构：B+树是一种平衡多路查找树，所有的数据节点都存储在叶子节点上。相比于B树，B+树更适合范围查询和排序操作。面试官：那么覆盖索引是什么？马架构：覆盖索引是指查询的数据可以通过索引直接获取，而无需回表读取数据。面试官：如何选择合适的索引？马架构：需要根据查询条件、数据分布和查询频率进行综合评估。面试官：请解释SQL执行计划中的`EXPLAIN`关键字的作用。马架构：`EXPLAIN`可以帮助我们分析SQL的执行过程，包括使用的索引、扫描行数等信息

PostgreSQL的扩展 pgcrypto

文牧之的博客

04-27

302

pgcrypto 是 PostgreSQL 提供的加密扩展，包含各种加密函数、哈希函数和随机数生成器，是数据库级加密的重要工具。

SQL面试之--明明建了索引为什么失效了？

m0_57098592的博客

04-27

649

索引相关面试问题

din-sql和c3-sql的区别

01-09

### DIN-SQL 和 C3-SQL 的主要差异及各自特点 #### 主要差异 DIN-SQL 和 C3-SQL 都致力于解决 Text-to-SQL 任务并利用了大型语言模型的能力，但两者之间存在一些关键的不同之处。 - **侧重点不同** DIN-SQL 更加注重任务分解和自我纠正机制的应用。这种设计使得该方法能够逐步处理复杂问题，并通过多次迭代改进生成的结果[^1]。相较之下，C3-SQL 则强调零样本学习能力以及提示词的设计质量对于最终效果的影响。此框架下的系统能够在无需额外训练的情况下适应新环境或领域内的查询需求[^5]。 - **实现方式** 对于 DIN-SQL 而言，其采用的是基于多轮对话的形式来进行 SQL 查询构建；而 C3-SQL 是依靠强大的预训练大模型本身所具备的知识完成从自然语言描述向结构化查询语句转换的过程[^2]。 #### 各自特点 ##### DIN-SQL 特点 - 提出了任务分解的方法论，有助于更好地理解输入文本中的逻辑关系； - 自我纠正功能允许算法在发现错误时自动调整输出结果直至满意为止； - 可能更适合那些具有明确阶段性和层次感的任务场景应用。 ##### C3-SQL 特点 - 凭借先进的预训练架构实现了真正的零样本泛化能力，在面对未知数据源时表现尤为突出； - 清晰有效的提示可以帮助引导模型生成更加精准合理的答案选项； - 使用 self-consistency 技术确保即使是在高度不确定性的条件下也能保持较高的准确性与稳定性。 ```python def generate_sql_query_din(input_text): # 基于DIN-SQL的SQL查询生成功能模拟 decomposed_tasks = task_decomposition(input_text) sql_query_drafts = [] for task in decomposed_tasks: draft = initial_sql_generation(task) corrected_draft = self_correction(draft, input_text) sql_query_drafts.append(corrected_draft) final_sql_query = combine_and_refine(sql_query_drafts) return final_sql_query def generate_sql_query_c3(input_text): # 基于C3-SQL的SQL查询生成功能模拟 multiple_inferences = multi_path_inference(input_text) valid_queries = filter_execution_errors(multiple_inferences) best_query = vote_for_best(valid_queries) return best_query ```