近期遇到深度学习相关问题及解答

问题如下

1.什么是硬注意力机制和软注意力机制

2.GoogleNet平均池化代替全连接

3.lstm的dropout有什么不同​​​​​​​

解答如下

1.软注意力机制的数学公式如下:

729ba454205a46088c7bf7fc60ec9112.jpg

对于软注意力,注意力模块相对于输入是可微的,因此整个系统仍然可以通过标准的反向传播方法进行训练

硬注意力机制的数学公式如下:

a0d81575d4ca4cb6a24608c3f0da4734.jpg

与软注意力模型相比,硬注意力模型的计算成本更低,因为它不需要每次都计算所有元素的注意力权重,模块不可微。

区别:软注意力机制更适合需要关注输入数据中多个重要部分的任务,而硬注意力机制则更适合需要选择输入数据中最重要部分的任务。

2.

平均池化内容如下

ce3904f5e7814222a478b13fc76978ad.png

 将h x w x c化成1 x 1 x d

优点:减少模型的参数数量,还使得模型具有更好的泛化能力和鲁棒性。

3.

afd95cbd0a2c4bd388c185efed14ccc6.jpg

 上图中新加的D代表dropout

85f0058f8fee452ab1b2bca4bc956d42.jpg

作者指出,dropout一定要设置在网络的非循环部分,否则信息将会因循环而逐渐丢失。我们把dropout设置在输入神经元上,如上图中虚线,那么因dropout造成的信息损失则与循环的次数无关,而仅仅与网络的层数相关。

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值