seq2seq编码器与解码器 --学习笔记

0、网络图结构

在这里插入图片描述
从上图可以看出,编码是一个RNN网络,当然可以是一个单向RNN也可以是一个双向RNN,C是一个context为背景变量,将输入信息进行编码汇总得到一个信息。接着由这个背景变量作为解码的输入,加上隐藏变量和输出变量,得到结果在进行映射,依次得到序列的每个预测结果。
在这里插入图片描述
以上x1,x2,x3分别表示时间步输入,h1,h2等分别表示时间步隐藏状态,y1,y2分别表示时间步输出,s1,s2分别表示输出时间步的隐藏状态。
注意:
(1)h0一般初始化为零向量;
(2)y0一般初始化为< bos >表示序列的开始(因为y0无法观测到);
(3)s0一般初始化为:系数W乘以输入序列的第一个字的反向隐藏层信息,在经过双正切激活函数tanh。
补充:
这里的背景变量C可以取自于输入编码的最后一个输出,也可以取自于q(h1,h2,h3,…,hT),这个函数q根据需求改变。

1、编码器

编码器的作用是把一个不定长的输入序列变换成一个定长的背景变量 c

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值