NLP-生成模型-2015：Seq2Seq+Copy【 Pointer网络的Copy机制是对传统Attention机制的简化：输出针对输出词汇表的一个概率分布 --＞输出针对输入文本序列的概率分布】

u013250861

已于 2024-02-14 13:57:22 修改

阅读量588

点赞数 1

分类专栏： # NLP/文本摘要 # LLM/Transformer 文章标签： Pointer Net 自动摘要 Copy机制

于 2021-08-25 21:08:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/119919579

版权

LLM/Transformer 同时被 2 个专栏收录

40 篇文章 13 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

NLP/文本摘要

19 篇文章 12 订阅

订阅专栏

本文介绍了Pointer Networks，它是对Seq2Seq模型和Attention机制的简化，尤其适用于输出序列是输入序列子集的情况。Pointer Networks通过直接输出针对输入序列的概率分布，解决了传统Seq2Seq模型在处理变长输出时的局限性，被应用于自动摘要等领域。

摘要由CSDN通过智能技术生成

《原始论文：Pointer Networks》

后续应用了Pointer Networks的三篇文章：

《Get To The Point: Summarization with Pointer-Generator Networks》；
《Incorporating Copying Mechanism in Sequence-to-Sequence Learning》；
《Multi-Source Pointer Network for Product Title Summarization》；

一、从Seq2Seq说起

Sequence2Sequence（简称seq2seq）模型是RNN的一个重要的应用场景，顾名思义，它实现了把一个序列转换成另外一个序列的功能，并且不要求输入序列和输出序列等长。比较典型的如机器翻译，一个英语句子“Who are you”和它对应的中文句子“你是谁”是两个不同的序列，seq2seq模型要做的就是把这样的序列对应起来。

由于类似语言这样的序列都存在时序关系，而RNN天生便适合处理具有时序关系的序列，因此seq2seq模型往往使用RNN来构建，如LSTM和GRU。具体结构见Sequence to Sequence Learning with Neural Networks 这篇文章提供的模型结构图：

在这里插入图片描述

在这幅图中，

了解本专栏

超级会员免费看

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
NLP-生成模型-2015：Seq2Seq+Copy【 Pointer网络的Copy机制是对传统Attention机制的简化：输出针对输出词汇表的一个概率分布 --＞输出针对输入文本序列的概率分布】

NLP-自动摘要-2015：Pointer Networks
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。