语义解析:将自然语言句子转换成计算机可识别的、可计算的、完全的语义表示,如lambda-表达式、SQL、语义图等
基于深度学习的语义解析方法
seq2seq,seq2tree,seq2act
优缺点:seq2seq仅把语义表示扁平序列化,忽略了层次结构信息。seq2tree 生成层次结构化的语义表示。attention学习词语到词语语义表示之间的软对齐。seq2action 用语义图表示语义,用动作序列编码语义图的构建
目标语言是形式化语言,这里的 decoder 使用严格的约束条件。
基于预训练的语义解析方法
GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing
根据Annotated Text2SQL Examples 抽取同步文法,采样新表格,利用同步文法在新表格的基础上生成新的(query, table, sql) 数据。 自然语言描述计算MLM loss ,text2sql 计算 SQL semantic loss。