📖标题:You Only Read Once (YORO): Learning to Internalize Database Knowledge for Text-to-SQL
🌐来源:arXiv, 2409.12172
摘要
🔸虽然在text-to-SQL任务上取得了重大进展,但最近的解决方案对每个问题重复编码相同的数据库模式,导致不必要的高推理成本,并经常忽略关键的数据库知识。
🔸为了解决这些问题,我们提出了You Only ReadOnce(YORO),这是一种新的范式,在训练过程中将数据库知识直接内化到text-to-SQL模型的参数知识中,并在推理过程中消除了对模式编码的需要。YORO显著减少了66%-98%的输入令牌长度。
🔸尽管输入时间较短,但我们的实证结果表明,YORO在三个基准测试中具有与传统系统相当的性能,并且在大型数据库上表现显著。此外,YORO在处理具有挑战性的值检索问题(例如缩写)方面表现出色。
🛎️文章简介
🔸研究问题:处理大规模数据库时,传统文本到SQL系统存在计算效率低下、信息遗漏以及依赖于额外的值检索步骤等问题。
🔸主要贡献:论文提出了一个名为YORO的新型文本到SQL范式,在