Training Very Deep Networks--Highway Networks

网上有传言 微软的深度残差学习是抄袭 Highway Networks,只是Highway Networks的一个特例。Highway Networks 的确是先发表的。

http://people.idsia.ch/~rupesh/very_deep_learning/

有开源代码

Our Highway Networks take inspiration from Long Short Term Memory (LSTM) and allow training of deep, efficient networks (even with hundreds of layers) with conventional gradient-based methods. Even when large depths are not required, highway layers can be used instead of traditional neural layers to allow the network to adaptively copy or transform representations

我们这个高速CNN网络受 LSTM启发,可以使用传统基于梯度的方法快速训练深度网络(几百层的)。即使不需要大的深度,高速网络也可以自适应表示合适的特征变换。

2 Highway Networks
一般一个 plain feedforward neural network 有L层网络组成,每层网络对输入进行一个非线性映射变换,可以表达如下
这里写图片描述
一般后续还有其他处理,例如非线性激活函数, convolutional or recurrent
对于高速CNN网络,我们定义一层网络如下
这里写图片描述
We refer to T as the transform gate and C as the carry gate
T和C分别表示 对输入的映射和直接传送。
在这篇文献中我们设置 C=1-T,则得到下式
这里写图片描述
上公式中参数的维数须一致。
我们观察到,对于特殊的T:
这里写图片描述
for the Jacobian of the layer transform:
这里写图片描述

Thus, depending on the output of the transform gates, a highway layer can smoothly vary its behavior between that of H and that of a layer which simply passes its inputs through

2.1 Constructing Highway Networks
如果 x,y,H,T的维数不一致,可以通过处理使其一致。

2.2 Training Deep Highway Networks
我们定义 transform gate 如下
这里写图片描述
W是权重矩阵, b是 bias 向量
This suggests a simple initialization scheme which is independent of the nature of H: b T can be initialized with a negative value (e.g. -1, -3 etc.) such that the network is initially biased towards carry behavior. This scheme is strongly inspired by the proposal [30] to initially bias the gates in an LSTM network, to help bridge long-term temporal dependencies early in learning

  初始化时可以给b初始化一个负值,相当于网络在开始的时候侧重于搬运行为(carry behavior),就是什么处理都不做。这个主要是受文献【30】启发。我们的实验也证明了这个推测是正确的。

这里写图片描述

这里写图片描述

这里写图片描述

highway-env是一种基于OpenAI Gym的Python环境,用于开发和测试自动驾驶系统的强化学习算法。其官方文档为开发者提供了必要的指南和说明,以帮助他们更好地了解和使用highway-env。 官方文档包含了对highway-env的介绍,包括其设计目标和使用场景。它解释了highway-env的核心概念,例如车道、车辆、动作和观察空间。文档还提供了一些基本概念和概述,以帮助开发者快速入门。 文档详细说明了如何安装和配置highway-env环境。它提供了安装所需的依赖项列表,并指导用户如何在Python环境中安装和设置highway-env。这有助于确保开发者能够正确地配置环境并准备好开始使用。 官方文档还介绍了highway-env中可用的不同类型的车辆和代理。它解释了如何使用不同的代理算法,例如DQN、PPO等,来构建和训练智能代理去驾驶车辆。此外,文档还介绍了各种可用的观察空间和动作空间,并给出了如何自定义它们的指导。 此外,文档还提供了一些示例代码和演示,用于展示如何使用highway-env。这些示例代码可以帮助开发者更好地理解和使用highway-env,以便在他们自己的项目中应用。 总之,highway-env官方文档为开发者提供了全面的指南和说明,帮助他们理解和使用highway-env以实现更好的自动驾驶系统。通过文档中提供的示例代码和演示,开发者可以更好地应用highway-env并根据自己的需求来进行定制。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值