NLP基础(五):CopyNet和PGN模型

本文介绍了自然语言处理中处理OOV问题的CopyNet模型和Pointer-Generator Networks。CopyNet通过generate-mode和copy-mode解决OOV问题,而Pointer-Generator Networks结合了seq2seq和Pointer Network,具备生成与复制的能力。
摘要由CSDN通过智能技术生成

1. OOV

摘要总结的结果有的时候并不准确,比如摘要的结果可能输出德国队以2-1比分击败阿根廷,但是实际比分是2-0。出现这种情况的原因是字典中没有2-0,即out-of-vocabulary words(OOV)。

2. CopyNet

CopyNet的模型可以分成左侧和右侧两个部分,左侧是一个对话模型,其实也是传统的翻译模型,由 encoder 和 decoder 两个模块构成。CopyNet有一个由概率建模的generate-mode和copy-mode。由于copy-mode的加入,decoder可以将输入直接复制过来,使用OOV的词。
CopyNet

3. Pointer-Generator Networks

原文中的Pointer-Generator Networks是一个混合了 Baseline seq2seq和PointerNetwork的网络,它具有Baseline seq2seq的生成能力和PointerNetwork的Copy能力。

PGN从Baseline seq2seq的模型结构计算 p g e n p_{gen} pgen
p g e n = σ ( w h ∗ T h t ∗ + w s T s t + w x T x t + b p t r ) p_{gen}=\sigma(w^T_{h^*} h^*_t+w^T_s s_t+w^T_x x_t+b_{ptr}) pgen=σ(wh

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值