![](https://img-blog.csdnimg.cn/direct/173e19193178496097ede62bfd0643c7.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Text2SQL
文章平均质量分 95
Text2SQL 相关研究方向
yubinCloud
哈尔滨工业大学 在校生
展开
-
【Text2SQL 论文】CodeS:Text2SQL 领域的开源语言模型
这篇论文开源了一个很不错的 Text2SQL 领域的 LLM,并同时开放了相关的新的数据集,在实际部署时,无论是基于 CodeS 还是另外再微调,这篇论文的思路都值得参考。原创 2024-06-14 16:33:23 · 276 阅读 · 0 评论 -
【Text2SQL 论文】CHESS:利用上下文来合成 SQL 的 pipeline
CHESS pipeline 在 BIRD 和 Spider 数据集上都取得了不错的表现。此外,CHESS 还开发了一个完全开源的版本,可以私有部署,且在 BIRD 上执行准确率超过 60%,缩小了闭源和开源 LLM 的性能差距,同时保证了企业数据隐私。但对于 BIRD 数据集,目前的模型仍然不如人类写 SQL 的表现,未来的工作应该旨在进一步缩小这个差距。此外,设计更高精度的 schema selection 方法是未来研究的一个高影响领域,可以对准确性产生巨大影响。原创 2024-06-11 17:31:06 · 706 阅读 · 0 评论 -
【Text2SQL 论文】PET-SQL:用 Cross-Consistency 的 prompt 增强的两阶段 Text2SQL 框架
PET-SQL 的两阶段思路还是挺好理解上,prompt 设计上主要多了 db content 样例,整个过程中,使用 question de-semanticization 来提取问题骨架表示问题意图在实现上应该是整个流程里最复杂的。原创 2024-06-08 15:05:53 · 1193 阅读 · 1 评论 -
【Text2SQL 论文】C3:使用 ChatGPT 实现 zero-shot Text2SQL
本文提出的 C3 基于 ChatGPT 实现了 zero-shot Text2SQL,并取得了 zero-shot 的最好性能。C3 从模型输入、模型偏差和模型输出三个角度为基于 GPT 的 Text2SQL 提供了系统的处理方法。这些方法值得后面的研究来参考。原创 2024-06-07 19:58:27 · 1223 阅读 · 1 评论 -
【Text2SQL 论文】How to prompt LLMs for Text2SQL
整的来说,论文在三种 Text2SQL ICL settings 中比较了各种 prompt constructions 的效果,为未来的研究提供了指导。原创 2024-06-06 21:02:51 · 728 阅读 · 0 评论 -
【Text2SQL】评估 LLM 的 Text2SQL 能力
⭐⭐⭐⭐。原创 2024-06-06 16:14:14 · 979 阅读 · 0 评论 -
【Text2SQL 论文】QDecomp:探索 CoT-style 的 prompt 来解决 Text2SQL
本文基于 Codex 的 LLM 来探索了 CoT-style 的 prompting 效果,增强了 LLM 对 Text2SQL 解析的推理能力。论文发现了 CoT 在 Text2SQL 任务中会出现错误传播问题,本文提出的 QDecomp 方法是缓解 LLM 多步骤推理中错误传播问题的尝试之一,之后值得对这个问题进行更深一步的探讨。原创 2024-06-04 22:11:52 · 1007 阅读 · 1 评论 -
【Text2SQL 论文】MAC-SQL:多个 Agents 合作来解决 Text2SQL
本论文利用多个 agents 合作的思路来解决 Text2SQL 任务,同时提供了一个开源的 SQL-Llama 模型,在 BIRD 数据集上实现了 SOTA 效果。原创 2024-06-04 11:37:10 · 897 阅读 · 0 评论 -
【Text2SQL 论文】DBCopilot:将 NL 查询扩展到大规模数据库
指的是:只给定 user question 而不给定预期的 SQL query schema(DB 和 DB tables),来生成一个可以在一个数据库集合中的某个 DB 上执行的 SQL。像之前 WikiSQL 数据集上,都是指定 question 在哪个 DB 上的。本文提出了 DBCopilot 模型,给出了一种将 NL 查询扩展到大规模数据库的思路,通过 LLM 协作来解决模式无关的 NL2SQL 任务。原创 2024-06-02 16:02:47 · 800 阅读 · 1 评论 -
【Text2SQL 论文】DIN-SQL:分解任务 + 自我纠正 + in-context 让 LLM 完成 Text2SQL
本论文设计的 prompt 以及思路让 LLM 在解决 Text2SQL 任务上有了不错的表现,产生了与最先进的微调方法相当甚至更优的结果。但是,本文的思路需要多轮与 LLM 交互,从而产生了巨大的花费和延迟,论文给出,在使用 GPT4 响应 Spider 数据集中 question 时表现出大约 60s 的延迟。原创 2024-05-31 21:38:29 · 867 阅读 · 0 评论 -
【Text2SQL 论文】T5-SR:使用 T5 生成中间表示来得到 SQL
本文模型是通过引入中间表示并使用 seq2seq(T5)来解决 Text2SQL 任务,同时论文中也指出了使用 seq2seq 在 Text2SQL 任务下的难点。该工作还引入了 SSQL 这样的中间表示,它比 SemQL、RAT-SQL IR 等中间表示要简单不少。原创 2024-05-30 16:45:16 · 1030 阅读 · 0 评论 -
【Text2SQL 论文】评估 ChatGPT 的 zero-shot Text2SQL 能力
与 ChatGPT 进行多轮交互,以解决生成不可执行的 SQL 语句的问题利用 DB 的报错来设计多轮对话,从而确保生成的 SQL 正确性引入 in-context learning。原创 2024-05-29 20:43:03 · 906 阅读 · 0 评论 -
【Text2SQL 论文】IncSQL:通过增量式生成 action 序列来得到 SQL
⭐⭐⭐。原创 2024-05-27 21:40:48 · 998 阅读 · 0 评论 -
【Text2SQL 论文】SeaD:使用 Schema-aware 去噪训练的 end2end 的 Text2SQL
实验在 test 结果上达到了 93 的准确率,但没有公开 code。但本文提出的思路还是值得学习的。原创 2024-05-26 15:43:08 · 303 阅读 · 0 评论 -
【Text2SQL 经典模型】HydraNet
在 WikiSQL 上做了实验,发现 HydraNet 的性能优于其他方法。尤其值得注意的是,其表现甚至与使用了 MT-DNN 作为 PLM 的 X-SQL 效果一样好,尽管 MT-DNN 明显比 BERT-Large 要好。另外,HydraNet 的架构更加简单,参数也更少,它只在 PLM 的输出中增加了 Dense 层。这样得到的 HydraNet 泛化性更好。原创 2024-05-25 16:50:42 · 958 阅读 · 0 评论 -
【Text2SQL 经典模型】X-SQL
通过以上改进,X-SQL 在表现 WikiSQL 上的表现提升到 90% 以上,超过了 SQLova:本文对 BERT-style 生成的 representation 的进一步的加工利用值得研究学习。原创 2024-05-24 22:01:41 · 774 阅读 · 1 评论 -
【Text2SQL 论文】SQLova:首次将 PLM 应用到 NL2SQL 中
这篇论文对 SQLNet 进行改进,首次尝试引入 PLM 来获得 context embedding。在实现思路上与 SQLNet 类似,也是先预先构建一个 SQL sketch,然后再填充 slots。本文提出的模型 SQLova 分为两个 layers:encoding layer 和 NL2SQL layer:在 NL2SQL layer 中,思路与 SQLNet 类似,使用了多个 model 来填充 SQL sketch 中的不同 slots 从而生成 SQL。分别介绍 SQLova 的两个 lay原创 2024-05-24 10:57:40 · 755 阅读 · 0 评论 -
【Text2SQL】WikiSQL 数据集与 Seq2SQL 模型
这篇论文给出了一个 WikiSQL 数据集,并提出了 Text2SQL 的一个解决方案以及评价指标。但是很明显,该方案存在不少缺点,之后的方案会继续改进。原创 2024-05-18 18:02:58 · 932 阅读 · 0 评论 -
【Text2SQL】Spider 数据集
模型将被在不同的复杂 SQL、复杂数据库、复杂 domains 上被测试,要求模型能够对 question 理解语义,并对新的数据库有泛化能力。任务不评估模型生成 value 的能力,因为这个 benchmark 侧重评估预测出正确的 SQL 结构和 columns,数据集中也被排除了需要常识推理和数学计算的 querys。论文工作还对数据库的 table names 和 column names 做了清洗,让这些名字清晰且自成一体。比如将stu id转为student id。原创 2024-05-19 22:12:20 · 940 阅读 · 0 评论 -
【Text2SQL 经典模型】SQLNet
⭐⭐⭐⭐。原创 2024-05-23 11:47:11 · 831 阅读 · 0 评论 -
【Text2SQL 经典模型】TypeSQL
借助于数据库的 table schema 检索和 knowledge graph 的检索,为 question 的每个 word 标注一个 type,从而提高 embedding 的效果当 database content 可用时,type 标注时还会进一步对 column content 做检索,并为其标注 column name,这样当用户的 question 中的所提到的列名或者条目不精确时,也可以通过这个步骤来对应到具体的数据库 column,从而提高效果,实现所谓的“内容敏感性。原创 2024-05-23 20:06:02 · 1058 阅读 · 0 评论