序列到序列学习(seq2seq)

1. 早期应用

在这里插入图片描述

2. 整体架构

在这里插入图片描述

  1. 输入序列的信息被编码到循环神经网络编码器的隐状态中。
  2. 独立的循环神经网络解码器是基于输入序列的编码信息和输出序列已经看见的或者生成的词元来预测下一个词元。
    在这里插入图片描述

3. 细节

在这里插入图片描述
在这里插入图片描述

4. 预测序列的评估

  1. 以通过与真实的标签序列进行比较来评估预测序列。

  2. 其中lenlabel表示标签序列中的词元数和 lenpred表示预测序列中的词元数,k是用于匹配的最长的n元语法。

  3. 另外,用pn表示n元语法的精确度,它是两个数量的比值:第一个是预测序列与标签序列中匹配的n元语法的数量,第二个是预测序列中n元语法的数量的比率。

  4. 具体地说,给定标签序列A、B、C、D、E、F 和预测序列A、B、B、C、D,我们有p1 = 4/5、p2 = 3/4、p3 = 1/3和p4 = 0。

  5. 当预测序列与标签序列完全相同时,BLEU为1。
    在这里插入图片描述

5. 小结

  1. • 根据“编码器‐解码器”架构的设计,我们可以使用两个循环神经网络来设计一个序列到序列学习的模型。

  2. • 在实现编码器和解码器时,我们可以使用多层循环神经网络。

  3. • 我们可以使用遮蔽来过滤不相关的计算,例如在计算损失时。

  4. • 在“编码器-解码器”训练中,强制教学方法将原始输出序列(而非预测结果)输入解码器。

  5. • BLEU是一种常用的评估方法,它通过测量预测序列和标签序列之间的n元语法的匹配度来评估预测。
    在这里插入图片描述

  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值