RNN中的Teacher Forcing

1. 什么是Teacher Forcing

​ Teacher Forcing(下面简称tf)是一种快速有效地训练递归神经网络模型的方法,这个方法名字听着很高端,其实应用非常简单,就是使用上一时间步的输入的groud truth作为输入,而取代了真实的目标输入。该技术广泛使用在了机器翻译,文本摘要,图像描述( image captioning)等,在训练递归网络时,tf可以加快模型的收敛速度以及提升模型的不稳定性。

2.序列预测问题

​ 我们实际生活中的很多问题都是序列问题,就拿我们熟悉的机器翻译来说,它对应的就是一种源语言的序列到目标语言的序列转换问题,在这类型的任务中,由于序列是依次产生的,所以天然适合seq2seq结构,而这类型的任务,如果直接使用目标序列作为输入指导训练,则有着收敛慢,模型稳定性差的问题。

​ 以实际例子演示一下该方法的使用情况:

​ 假如我们有一个句子“ Your plan sounds good.”,我们希望输入当前的单词,可以得到下一个单词,比如当输入“plan”的时候,我们期待能够输出“good", 让我们演示一遍:

  1. 针对句子添加开始符号"sos"与终止符号"eos",变成 “ sos Your plan sounds good eos”

    </
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值