【P11】X-SQL: reinforce schema representation with context

X-SQL: reinforce schema representation with context

Abstract

针对 NL-to-SQL 的解析问题,本论文提出了一种新的网络体系结构 X-SQL。利用 bert 风格的预训练模型(MT-DNN)的上下文输出来增强结构模式表示(schema representation),并结合类型信息(type information) 来学习用于下游任务的新模式表示。

1 Introduction

X-SQL 从以下三个方面做出了贡献:

  1. 表列之类的结构化信息相对稳定,但自然语言查询是高度可变的。利用 MT-DNN 来捕获这种变化,并将非结构化查询(unstructured query)总结为全局上下文表示,然后将其用于增强下游任务的结构化模式(structured schema)表示
  2. 部分SQL的语法结合类型信息。例如,aggregator MIN只出现在数值列中,运算符">"不能与字符串类型的列配对。在两个地方合并模式类型信息:
    • 通过对预先训练的语言表示的修改进行类型嵌入
    • 使用单独学习的类型嵌入来进一步改进某些子任务
  3. 在预测where子句时,采用了全局排序方法,使用 KL 散度作为目标,将所有列放到一个可比较的空间中,从而有效地建模列之间的关系。

2 Neural Architecture

三层结构:

  • Sequence Encoder
  • Context Enhanced Schema Encoder
  • Output Layer
    完成SQL语句的生成,将其分为6个子任务(select-column, select-aggregation, where-number, where-column, where-operator, and where-value),这六个任务彼此之间相互结合,彼此制约。

详见:
自然语言到 SQL 语句,微软只用六个子任务,结果超越人类水平

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值