Spider数据集arxiv1809.08887论文研读

Spider数据集旨在解决现有语义解析数据集规模小、泛化能力弱的问题,提供多表数据库和复杂SQL查询,强调模型在新数据库上的泛化。论文详述了数据集构建过程、特点、评估指标,并通过实验展示了现有模型在此任务上的挑战性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. Introduction

  1. 过去一些优秀的模型例如seq2seq架构已经能够实现80%以上的匹配精确度在SQL查询上,但是这些工作实际上是在做语义匹配而非语义解析。现有的语义解析数据集存在两个问题,一个是数据集规模太小,无法训练一个更加现代化的模型,同时单一数据库同时用于训练和测试当中,那任务难度肯定简单很多;二是逻辑形式的SQL标签规模很小,并且每个program中都多多少少存在一些在数据集规模变大时查询有误的问题。
  2. 有人测试了尝试分开训练集和测试集上的数据库以后,发现模型无法推广到没看到过的数据库中,也就是泛化能力较差,另外数据集类似WikiSQL,SQL查询难度过于简单,无法很好的测试模型在复杂问题上的表现,因此亟需一个包含大量复杂程序和多表数据库的SP数据集。
  3. 创建此类的SP数据集有以下难度:在线平台上很难找到那么多的数据库同时有很多表;另外标注的人也必须要理解复杂数据库的模式从而创建出一系列的查询问题并且包含了所有SQL的查询类型。并且还需要对问题和SQL进行审查和质量检查,这些都需要非常充足的数据库知识。
  4. Spider的好处在于可以在SQL查询上实现训练集和测试集在database上的区分,克服了之前数据集的两个缺点。并且定义了一个新的任务模式,模型不仅需要推广到新的程式,也就是查询组合方式,同时还需要推广到新的数据库。测试发现目前最先进的模型仅实现了12.4%的精确匹配精度。表明提升空间还很大。

2. Related Work and Existing Datasets

  1. 具有不同查询的语义解析数据集已经有很多了,但是都是针对于特定的domain,并且
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

芋饭糖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值