论文浅尝 | 基于知识图谱难度可控的多跳问题生成

最新推荐文章于 2024-07-05 11:57:42 发布

开放知识图谱

最新推荐文章于 2024-07-05 11:57:42 发布

阅读量2.1k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/104351959

版权

论文提出了一个神经网络模型，利用知识图谱生成复杂多跳问题，且能控制问题难度。模型基于Transformer，输入为子图和预设答案，输出为自然语言问题。实验表明，该模型能生成高质量、与子图相关的问题。

摘要由CSDN通过智能技术生成

论文笔记整理：谭亦鸣，东南大学博士生，研究兴趣：知识图谱问答。

来源：ISWC 2019

链接：https://link.springer.com/content/pdf/10.1007%2F978-3-030-30793-6_22.pdf

本文提出一个end2end神经网络模型以知识图谱为数据源，自动生成复杂的多跳问题，且问题难度是可控的。该模型以一个子图（来自知识图谱）及预设的问题答案为输入，利用基于transformer的模型生成自然语言问题。问题难度的控制因子基于命名实体的popularity指标构建得到。实验方面，利用现有的两个2-hops问答数据集，构建训练/测试数据得到的实验结果验证了该模型可以生成高质量，流利，且与输入子图密切相关的自然语言问题。

相关数据集和源码链接传送门：https://github.com/liyuanfang/mhqg.

动机

目前最好的KG QA模型基于神经网络建立，这种数据驱动的模型需要大量的训练数据，包括知识图谱中的三元组集，问题集以及对应的答案数据。为了迎合这种数据需求，近些年来，很多问答数据集被构建出来，包括简单的Single-hop信息的问题，以及更复杂信息的问题。其中复杂问题数据集又大体可以分为两类：多跳推理或者离散型推理问题。

但是，随着上述数据集被充分利用之后，模型性能的进一步提升又受到了数据集规模的限制，虽然这对Single-hop问答没什么影响，其性能在实验数据上已经媲美人类问答水平（Single-hop问题难度并不高），对于复杂问题则不然，其依然需要更多高质量的问答数据集提升模型的质量。显然复杂问题相对简单问题数据的建立难度更高，大部分现有的复杂问题都是基于人工或半自动的方式得到。

因此本文拟利用现有的复杂问题集作为训练数据（包含问题子图，对应的自然语言问题reference以及答案，来自COMPLEXWEB

最低0.47元/天解锁文章

开放知识图谱

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
论文浅尝 | 基于知识图谱难度可控的多跳问题生成

论文笔记整理：谭亦鸣，东南大学博士生，研究兴趣：知识图谱问答。来源：ISWC 2019链接：https://link.springer.com/content/pdf/10...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。