1. OOV
摘要总结的结果有的时候并不准确,比如摘要的结果可能输出德国队以2-1比分击败阿根廷,但是实际比分是2-0。出现这种情况的原因是字典中没有2-0,即out-of-vocabulary words(OOV)。
2. CopyNet
CopyNet的模型可以分成左侧和右侧两个部分,左侧是一个对话模型,其实也是传统的翻译模型,由 encoder 和 decoder 两个模块构成。CopyNet有一个由概率建模的generate-mode和copy-mode。由于copy-mode的加入,decoder可以将输入直接复制过来,使用OOV的词。
3. Pointer-Generator Networks
原文中的Pointer-Generator Networks是一个混合了 Baseline seq2seq和PointerNetwork的网络,它具有Baseline seq2seq的生成能力和PointerNetwork的Copy能力。
从Baseline seq2seq的模型结构计算 p g e n p_{gen} pgen
p g e n = σ ( w h ∗ T h t ∗ + w s T s t + w x T x t + b p t r ) p_{gen}=\sigma(w^T_{h^*} h^*_t+w^T_s s_t+w^T_x x_t+b_{ptr}) pgen=σ(wh