Seq2Seq

关于seq2seq,我看过这位博主的文章,并且也去实践过,当时还将他的文章整理成博客笔记。但是,当时对seq2seq的理解确实不是很到位,所以昨天看到这位博主时是很疑惑的。原本以为encoder端的输出直接接一个decoder就行,但是这位博主还重复利用了encoder的输出向量,每次都与decoder的输出混合送入分类器预测。而一般的seq2seq只是在开始的阶段参与了计算,后续并没有。此篇博客,是我对作者的整理,仅供自己学习之用。

Seq2Seq简介

seq2seq,顾名思义就是序列对序列,一般应用与机器翻译,自动文摘,而本文正是用自动文摘举例(当时,机器翻译举例也简单)。

基本结构

假设输入为X=(a, b, c, d, e, f),需要的输出为Y=(P, Q, R, S, T),那么一个基本的seq2seq如下,encoder输出的向量参与每一次运算。图来自论文

img_eed779a0925c81a1e8dd4a628a15e3ad.png

可能大家最常见到的是这个图,encoder输出的向量只参与一次运算的这种:
img_ac3ea7454fe4cbc6397d259845f53e3a.png

代码实现

源码部分,我还没写,先保留这三个连接
[1].https://mp.weixin.qq.com/s/IjX8ZztFdvUuHNEKxYMILw
[2]. https://blog.keras.io/a-ten-minute-introduction-to-sequence-to-sequence-learning-in-keras.html
[3]. Sam Wiseman and Alexander M Rush. Sequence-to-sequence learning as beam-search optimization. In EMNLP, 2016.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值