这一篇实际上叫GrailQA,作者是俄亥俄州立大学的Yu Gu.
一、复现说明
我对这篇文章尝试过复现,但是复现情况不理想,主要原因在于Freebase数据集下载下来后发现是个.db的文件,而且暂未能入库virtuoso,所以绷住了。不过数据集已经下来并成功存到阿里云盘了(是Yu Gu自己改造过的那份Freebase 50G的,官网的Freebase今天下结果下到23G网站好像崩了,打开页面也打不开)想要的话可以邮箱私信1317738619@qq.com,包括那几个小的几百MB的数据集,不过那几个应该大家都能下下来。
二、论文阅读
①介绍。
该文章做了很多定义性的工作,I.I.D. Generalization(泛化),Compositional Generalization(组合泛化),Zero-Shot Generalization(零命中泛化)。这三个做了定义,并创造了一个叫GRAILQA的有64331个众包问题,四种关系和函数,如计数、比较和最高级的在2021/2022年左右来讲最大的KBQA复杂问题数据集。该问题数据集基于FREEBASE COMMONS部分做的。
其次是对模型进行优化,使用预先训练的语言模型(例如BERT)增强了泛化能力。相比之前进步了3.5%。在预训练对泛化的帮助上证明了有很大的提高作用。并且可以彻底检查KBQA中的几个挑战,search space pruning and languageontology alignment(搜索空间修剪和语言本体对齐)。
②知识背景(定义)。