论文阅读 Question Generation

最新推荐文章于 2024-04-19 09:43:01 发布

thormas1996

最新推荐文章于 2024-04-19 09:43:01 发布

阅读量3.4k

点赞数 2

分类专栏：自然语言处理文章标签： NLP 问题生成论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/thormas1996/article/details/81015549

版权

这篇博客介绍了NLP领域中关于问题生成（Question Generation, QG）的几篇重要论文，包括如何使用RNN生成事实型问题、端到端的神经问句生成以及机器阅读理解中的QG研究。这些工作大多基于seq2seq模型和注意力机制，旨在从文本中生成有意义的问题。论文评估标准主要为BLEU、METEOR和Emb. Greedy等。" 117022119,9080024,Git完整指南：从安装到IDEA集成,"['Git', 'GitHub', '版本控制', 'IDE集成']

摘要由CSDN通过智能技术生成

对seq2seq模型，attention机制以及NLP评价标准不了解的同学可以看的另外三篇笔记（暂未完成），文中将不仔细介绍这些内容，有疏漏或者补充欢迎评论~

QG相对QA来说研究少了不少，粗略在arxiv搜过，2017年才陆续看到几篇seq2seq相关的工作，也可能是我疏漏了一些文章。

mark：另一篇笔记对QG做了一个简短的总结：问题生成（QG）总结

论文

论文

Generating Factoid Questions With Recurrent Neural Networks: The 30M Factoid Question-Answer Corpus

Yoshua Bengio, University of Montreal, Canada 2016
原文地址

作者目标是基于知识库（KB）生成大量问题，方法是将一个事实转化为一个满足以下两个条件的问题。一个是问题要与这个事实的relationship和subject相关，第二点是问题的答案应该就是这个事实的object。

知识库的结构类似于有向图，一个fact可以视为含有三个参数subject，object和relationship，前两者是node，后者是edge。{subject->object}

模型：

P(Q|F)=∏Nn=1P(ωn|ω<n,F) P ( Q | F ) = ∏ n = 1 N P ( ω n | ω < n , F ) ${P(Q|F) = \prod_{n=1}^N P(\omega_n |\omega_{<n},F)}$

F代表fact，Q代表question ( ${\omega_1,\omega_2,...,\omega_n}$ )

结构：

模型就是一个带attention的seq2seq模型，encoder+decoder
encoder是将fact的三个参数分别embedding后直接拼接得到语义向量c
decoder是一个GRU RNN，attention是bahdanau attention

数据集：SimpleQuestions dataset

查了一下，居然是memory net的提出者FB大佬Antoine Bordes的文章

评价标准：BLEU，METEOR，Emb. Greedy

实验结果：
与baseline对比实验结果
例子：

Learning to Ask: Neural Question Generation for Reading Comprehension

Xinya Du, Cornell University, ACL 2017
原文链接

本文似乎是第一个用seq2seq端到端结构来做QG的，之前基本是基于规则的做法，将词填入规定好的模板。这篇文章的做法也是基于一个attention+seq2seq的结构，输入同时考虑了句子和文章，相比baseline模型有显著的提升

这篇文章的code已经开源了，是用pytorch实现的，地址：
https://github.com/xinyadu/nqg

模型：

y=argmaxP(y|x)

最低0.47元/天解锁文章

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。