Highway Networks

参考链接

论文链接:https://arxiv.org/pdf/1505.00387v2.pdf

目标

深层神经网络相比于浅层神经网络具有更好的效果,在很多方面都已经取得了很好的效果,特别是在图像处理方面已经取得了很大的突破,然而,伴随着深度的增加,深层神经网络存在的问题也就越大,像大家所熟知的梯度消失问题,这也就造成了训练深层神经网络困难的难题。2015年由Rupesh Kumar Srivastava等人受到LSTM门机制的启发提出的网络结构(Highway Networks)很好的解决了训练深层神经网络的难题,Highway Networks 允许信息高速无阻碍的通过深层神经网络的各层,这样有效的减缓了梯度的问题,使深层神经网络不在仅仅具有浅层神经网络的效果

模型架构Highway Networks Formula

  • 对于普通的神经网络,每一层H(H表示的是网络的一层)表示从输入x映射到输出y,H通常是一个仿射变换和一个非线性变换(一个全连接层),H也采用其他的形式,像卷积神经网络和循环神经网络,公式如下: y = H ( x , W H ) y=H(x,W_H) y=H(x,WH)其中x表示输入,y表示输出, W H W_H WH表示这一层的参数权重
  • 对于Highway Networks神经网络,增加了两门:一个是转化门 T(transform gate) 和一个是 保存/携带门C(carry gate),其中 T = s i g m o i d ( w x + b ) , c = 1 − T T=sigmoid(wx + b),c=1-T
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值