NLP
文章平均质量分 88
麦香猪扒饭
这个作者很懒,什么都没留下…
展开
-
Semantic parsing with dual learning论文阅读
Abstract这篇文章做的是semantic parser,NL to logic form。作者认为这个领域标注的label的数量过少是semantic parser的一个挑战。作者提出了duel learning algorithm,能够充分利用数据的标签。模型有两部分组成,semantic parser model + dual model,并提出了一个新的reward signal。Introduction以往的semantic parser存在两个问题,1)缺乏足够的数据,如果需要标注足够原创 2021-06-17 11:04:05 · 253 阅读 · 0 评论 -
Logic2Text: High-fidelity natural language generation from logical forms论文阅读
Abstract这篇文章是2020的EMNLP,做的是文本生成。是通过logic form+table的方式生成句子。属于Neural Language Generation from structural data这个领域,利用结构数据生成自然语言。以往的一些生成方法都是利用多行表格直接生成句子,但是这种方法存在两个缺点,难以控制,不能保证是真实的。 这篇文章提出的model能够利用结构化数据和logic form生成可控并且真实的句子,并提供了一个新的数据集,做了两个实验。在强监督下的实验,Few-s原创 2021-06-16 10:13:57 · 269 阅读 · 0 评论 -
Reranking for neural semantic parsing论文阅读
Abstract这篇文章也是关于semantic parser的文章,以往一些基于深度学习的semantic parser取得了很大的进步,但是如果手动去验证这些生成的程序就会发现有很多的问题,比如生成的程序不协调,不合适。这篇文章提出的reranker对n个最好的predicted MRs做排序,也就是利用ranking方法做优化。rank的优化方法的文章之前有一篇NEURAL PROGRAM PLANNER FOR STRUCTURED PREDICTIONS Jacob有点像,也是用ranking做原创 2021-05-17 22:59:56 · 233 阅读 · 0 评论 -
Learning semantic parsers from denotations论文阅读
Abstract这篇文章解决的还是semantic parser的问题,主要的实验还是在WikiTableQuestion和WikiSQL上进行。将文本问题转换成程序,通过一个computer执行。这篇文章提到了semantic parser的两个难点,一个是存在假程序,也就是答案正确但是程序本身是错误的。另一个就是搜索空间过大的问题。spurious program的问题其实就是MAPO要解决的bias的问题,所以这篇文章要解决的问题和MAPO是差不多的,只不过方法不一样,MAPO是针对存在这一类问题的原创 2021-04-27 12:44:17 · 198 阅读 · 0 评论 -
TABERT: Pretraining for Joint Understanding of Textual and Tabular Data论文阅读
AbstractBert是对纯文本做的预处理语言模型,而现有的很多数据集是半结构化的,如表格等等。所以文章提出了TaBert模型,这个模型能够学习如何表达文本语句和半结构化的表格。并在WikiTableQuestion和Spider上取得良好的效果。...原创 2021-04-21 21:15:29 · 1063 阅读 · 0 评论 -
GRAPPA: Grammar-augmented pre-training for table semantic parsing论文阅读
Abstract这篇文章是还没发表,放在Arxiv上的一篇文章,这篇文章是目前wikiTableQuestion的SOTA,达到了52.7%。另外这篇文章多个监督和弱监督任务都超出目前的SOTA了,估计也是最佳的。这篇文章主要是对于table semantic parser的预训练。他们通过一些已经存在的text-SQL数据集,也就是给定一句话,这句话所对应的SQL语句也给出的这类数据,使用上下文无关文法在相应的表格上构建question-SQL对,然后使用他们的方法和数据对现有模型做预训练。其实就是用原创 2021-04-19 14:50:25 · 488 阅读 · 0 评论 -
Parsing with compositional vector grammars论文阅读
Abstract这篇文章是2013年的老文了,发表在ACL上,和现在大部分NLP深度学习文章不同,文章是关于语义解析领域,和目前NLP with DL的领域不一样,主要关注的是对文法语义的解析。类似英文的语法分析,parser对句子做出结构拆分,区分出动词名词等等。标准的一些句法描述是使用一些粗糙的类别(名词短语NP,形容词短语PP)来标注短语,但是这些划分是远远不够的,粗糙的划分可能会导致句法的混淆,所以可以对类别进行细化有可以区分出动词名词等等。而一些容易混淆的句子,则可以用向量来表示,上图中每原创 2021-03-20 13:37:21 · 274 阅读 · 0 评论