©PaperWeekly 原创 · 作者 | 徐叶琛
单位 | 字节跳动
研究方向 | NLP语义理解、问答系统
自然语言处理语义解析子任务 Text2SQL 旨在将用户的自然语言转换为 SQL 序列,继而完成数据库查询工作,打破了人与结构化数据库之间的壁垒,具有广泛的研究&应用价值。
近日,微软亚洲研究院联合北航和西安交大,发布了全新跨领域多轮交互 Text2SQL 中文数据集 CHASE,相关论文已被 ACL 2021 接收。
本文从现有 Text2SQL 数据集、CHASE 主要特点、解决方案测评等角度来讲解这篇顶会论文。随同数据集发布的还有同名公开榜单。
论文标题:
CHASE: A Large-Scale and Pragmatic Chinese Dataset for Cross-Database Context-Dependent Text-to-SQL
论文链接:
https://xjtu-intsoft.github.io/chase/
Text2SQL任务和数据集
典型的 Text2SQL 任务是给定一张表格 ,用户输入自然语言问句 ,模型自动生成相应SQL序列