论文阅读：CopyNet

最新推荐文章于 2021-08-26 17:15:05 发布

张小彬的代码人生

最新推荐文章于 2021-08-26 17:15:05 发布

阅读量1w

点赞数

分类专栏： NLP 论文文章标签： seq2seq NLP CopyNet

本文链接：https://blog.csdn.net/zhangxb35/article/details/76649861

版权

CopyNet 是一种在 Seq2Seq 模型基础上结合拷贝机制的NLP技术，适用于特定任务。模型包含预测拷贝和生成模式，通过Decoder的隐藏状态预测输出单词。拷贝模式通过Attention机制更新状态，允许模型从输入序列中直接复制单词。Selective read 功能用于连续拷贝长短语。然而，论文中未详细说明编码器RNN如何处理位置信息，以及如何实现概率计算。

摘要由CSDN通过智能技术生成

论文《Incorporating Copying Mechanism in Sequence-to-Sequence Learning》

CopyNet 是在 Seq2Seq + Attention 的基础上，引入了拷贝机制，对某些任务会有所擅长。模型结构如下图

实现上有关键两点（即图中右边的上下两个矩形框），

Prediction with Copying and Generation

即从 decoder hidden state， $\boldsymbol{s}_t$ ，到预测输出单词 $y_t$ 的过程。本来直接一个线性映射就可以了，现在有点麻烦。

$p(y_t)$ 的概率分两个模式构成，

Generate-Mode
- 对于在输出词表 $\mathcal{V}$ 中的单词 $v_i$ ，有 $φ (y t = v i) = W o s t, v i \in V \cup UNK (1)$ $\varphi(y_t = v_i) = \mathbf{W}_o\mathbf{s}_t, \quad v_i \in \mathcal{V} \cup \small\text{UNK}\tag{1}$
- 上面 $\mathbf{W}_o \in \mathbb{R}^{(N + 1) \times d_s}$ ， $\mathbf{s}_t \in \mathbb{R}^{d_s}$ ， $d_s$ 是 $\mathbf{s}_t$ 的维度大小。
Copy-Mode
- 对于在输入中出现的单词，预测的概率有

最低0.47元/天解锁文章

张小彬的代码人生

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
5
评论
论文阅读：CopyNet

论文《Incorporating Copying Mechanism in Sequence-to-Sequence Learning》CopyNet 是在 Seq2Seq + Attention 的基础上，引入了拷贝机制，对某些任务会有所擅长。模型结构如下图实现上有关键两点（即图中右边的上下两个矩形框），Prediction with Copying and Generati...
复制链接

扫一扫

专栏目录