Attention

目录

match的输出

match的输入

attention扩展

训练技巧

权重正则化

Scheduled sampling

Beam search

Objective level


attention机制相比于普通的seq2seq最重要的区别在于引入了match块。

 

match的输出

match块的输出实际上是输入序列的权重,通过match块输出的变化,神经网络对于输入序列不同的位置的关注度发生变化,从而实现“attention”的效果。

match的输入

Match的输入在一般情况下,包含h和z,h代表输入序列的当前位置,而z则代表decoder的隐藏层的状态,在这种输入下,match的输出ɑ则代表输入序列当前位置在decoder的当前位置的权重,是一个标量。

以下是几种match的具体实现

attention扩展

在attention之外,还有类似的memory network,nural turning network,主要用于问答系统

训练技巧

权重正则化

通过数学方法,缩小权重之间的差距,一般情况会有更好效果?

Scheduled sampling

 

Beam search

Objective level

R无法求导,所以无法进行梯度下降,但是可以用增强学习解决

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值