【深度学习】Pointer Network

最新推荐文章于 2023-08-24 21:46:31 发布

布纸所云

最新推荐文章于 2023-08-24 21:46:31 发布

阅读量415

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/XindiOntheWay/article/details/108481321

版权

22 篇文章 0 订阅

订阅专栏

Pointer Network

传统的 seq2seq 模型会预先固定输出的词汇表，无法解决 输出序列的词汇表会随着输入序列长度的改变而改变 的问题，如寻找凸包等。对于这类问题，输出往往是输入集合的子集。

下图是凸包问题示例：
在这里插入图片描述

Pointer Network 的主要特点如下：

Pointer network 是通过 neural attention 机制来解决输出 dictionary 依赖于输入长度的问题的
与一般的 attention 方式不同的是， pointer network并不是在decoder的每一步使用attention 对 encoder 的 hidden units 加权求和，而是 直接利用attention 作为指针去选出 input sequence 中的一个去作为输出

在这里插入图片描述

在这里插入图片描述

在文本摘要任务中，可以用Pointer Networks来复制源文本中的单词。
比如 pointer-generator: https://arxiv.org/pdf/1704.04368.pdf
在这里插入图片描述

在这里插入图片描述

关注