《原始论文:Incorporating Copying Mechanism in Sequence-to-Sequence Learning》
本文开篇,作者就提出他们的目标是解决seq2seq模型的复制问题,并且提供了一个例子:
在这个例子中,我们要对用户提出的问题做出回答,显然,蓝色部分根本不需要理解语义,直接复制即可。针对这种情形,作者希望能赋予seq2seq复制的能力。
解决方案其实和前一篇ACL17(《Get To The Point: Summarization with Pointer-Generator Networks》)的文章有些类似。ACL17的文章相对较为通俗易懂,我们在读过它后再来理解ACL16(《Incorporating Copying Mechanism in Sequence-to-Sequence Learning》)的文章会更容易。
模型包含两个部分