ACL 2021|CHASE: 首个跨领域多轮Text2SQL中文数据集

CHASE是微软亚洲研究院等机构发布的首个跨领域多轮Text2SQL中文数据集,包含丰富的上下文依赖和模式链接关系,旨在推动自然语言处理在数据库查询中的应用。数据集规模大,具有挑战性,对现有SOTA模型提出更高要求。
摘要由CSDN通过智能技术生成

©PaperWeekly 原创 · 作者 | 徐叶琛

单位 | 字节跳动

研究方向 | NLP语义理解、问答系统

自然语言处理语义解析子任务 Text2SQL 旨在将用户的自然语言转换为 SQL 序列,继而完成数据库查询工作,打破了人与结构化数据库之间的壁垒,具有广泛的研究&应用价值。

 

近日,微软亚洲研究院联合北航和西安交大,发布了全新跨领域多轮交互 Text2SQL 中文数据集 CHASE,相关论文已被 ACL 2021 接收。

 

本文从现有 Text2SQL 数据集、CHASE 主要特点、解决方案测评等角度来讲解这篇顶会论文。随同数据集发布的还有同名公开榜单。

 

论文标题:

CHASE: A Large-Scale and Pragmatic Chinese Dataset for Cross-Database Context-Dependent Text-to-SQL

论文链接:

https://xjtu-intsoft.github.io/chase/

Text2SQL任务和数据集

典型的 Text2SQL 任务是给定一张表格 ,用户输入自然语言问句 ,模型自动生成相应SQL序列

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值