【Text2SQL 论文】CHESS：利用上下文来合成 SQL 的 pipeline

最新推荐文章于 2025-04-08 09:45:55 发布

yubinCloud

最新推荐文章于 2025-04-08 09:45:55 发布

阅读量1.5k

点赞数 16

分类专栏： Text2SQL 文章标签：数据库 Text2SQL 人工智能语言模型自然语言处理深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45668004/article/details/139604573

版权

文章目录

一、论文速读

本文提出了一个 pipeline 框架——CHESS——来解决应用于复杂的真实数据库场景下的 Text2SQL 问题。

在现实场景下，数据库 schema 通常包含不明确的 column name、table name 和混乱的数据，这都对 SQL 转换问题提出了挑战，因此需要一个健壮的检索系统来识别出其中相关的信息。下图展示了一个在做 Text2SQL 时会面临的挑战：

在这里插入图片描述

1）用户问题可能没有确切的数据库值
2）column name 可能不能很好的表示这一列存储了什么数据，因此需要 database catalogs 信息来辅助
3）对于一个 question，有多种 SQL 写法

在以往的研究中，大多将 SQL 生成的上下文限制为 table schema、column 定义和 sample rows，但在生产级数据库中，db catelog、db value 也是重要的辅助信息。

本文提出了 CHESS，一个针对现实世界的复杂 DB 的 Text2SQL 系统，它引入了一个 scalable、effective 的 LLM-based 的 pipeline 用于 SQL 生成，主要由三个组件构成：entity and context retrieval、schema selection、SQL generation。

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。