现代循环神经网络

1.门循环神经网络(GRU)

2.长短期记忆神经网络(LSTM)

3.深度循环神经网络

4.双向循环神经网络

\leftarrow这个方向的H:

        ①先将输入的顺序进行颠倒 

                =》得到输入X_{T}X_{1}

       ②颠倒的输入传入网络

                =》得到\overleftarrow{H_{T}}\overleftarrow{H_{1}}

        ③将网络输出的H颠倒

                =》然后将得到的H顺序颠倒得到\overleftarrow{H_{1}}\overleftarrow{H_{T}}

        ④将正常输入得到的\overrightarrow{H_{i}}与颠倒输入③中得到的\overleftarrow{H_{i}}进行dim=0维度上的合并,最后丢给输出层。

5.sequence to sequence

5.1编码器

        其中前面的编码器是一个RNN(可以是简单的RNN、GRU、LSTM);

        编码器只是将最后一个时刻的隐藏状态传给解码器;

        encoder可以是双向的,因为不需要进行预测;

5.2解码器

        解码器也是一个RNN;

        首先将编码器的隐藏层输入到解码器;

        然后在第一时刻输入<bos>表示开始翻译;

        第一时刻解码器的的翻译作为下一个时刻的输入;

        ...

        直到遇到<eos>表示停止。

 5.3编码器解码器细节

 训练时将正确的句子作为输入,即使前一个预测错误了,但是下一个输入任然为正确的输入;

但是推理的时候则不同,每一次的推理都基于前一个时刻的预测单 

5.4衡量生成序列的好坏的BLEU

其中:P1对应的是一元语法的unigram预测正确的概率:P1=4/5;

          P2对应的是二元语法的diagram预测正确的概率:AB、BC、CD,预测正确的有3个

          ...

 5.4总结

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值