Efﬁcient Training of Very Deep Neural Networks for Supervised Hashing

最新推荐文章于 2022-03-22 23:23:27 发布

LIUHUANUCAS

最新推荐文章于 2022-03-22 23:23:27 发布

阅读量711

点赞数 1

分类专栏：论文文章标签：神经网络

本文链接：https://blog.csdn.net/liu2012huan/article/details/52604894

版权

1.介绍
这篇文章主要说如果高效的训练深层的神经网络。对于现存的模型，由于一些限制，比如梯度消失的情况，只能限于训练一些比较浅层的网络。而且这种模型的效率并不高。所以作者就提出来一种可以高效训练深层网络的方法。具体的是：训练过程当中引入辅助变量，通过更新辅助变量，来达到某一层的局部最优解。通过实验发现，这种方法可以训练64个隐藏层，每层1024个节点的网络，而训练的时间在3个小时左右。

2.Very Deep Supervised Hashing 方法
对于 $N$ 个结合的数据 $X={\{x_i\}}_{i=1}^N \in R^{d \times N }$ ，目标是通过学习获得一系列的 $K$ bit的HashCode， $B \in \{ -1,1\} ^{K\times N},b_i \in \{-1,1\}^K$ ,每一列都表示一个数据 $x_i$ 的HashCode.
为了学习这些HashCode,我们把模型假设为 $F(x,\Theta)$ ,可以认为这个就是所要学习的模型表示。然后对于这个输出进行二值化就能够得到所要的HashCode。二值化的方式：

b i = s g n (F (x i, Θ)), s g n (x) = {1 - 1 x ⩾ 0 x < 0

$b_i = sgn(F(x_i,\Theta)) ,sgn(x) = \left\{\begin{matrix} & 1 & x \geqslant 0 \\ & -1 & x \lt 0 \end{matrix}\right.$
下面是对于作者的特定的任务，来进行损失函数的目标函数的定义
什么样的Hash Code，才是好的Hash Code呢？
作者假设，如果学习到的HashCode，能够在后面的任务当中产生好的结果，比如对于分类任务，分类的准确性更高，那么就认为学习到的Hash Code是较为理想的。下面作者就把学习Hash Code和分类任务结合在一起，放到一个过程当中来进行学习。
损失函数的定义：
对于学习到的Hash Code，通过一个线性分类器就能够得到一个分类的结果。
假设需要分类的类别共有

C $C$ 类,每一条数据的标签为

yi=[yi1,yi2⋯yiC] $y_i=[y_{i1},y_{i2} \cdots y_{iC}]$ 如果

xi $x_i$ 属于类别

j $j$ 那么

yij=1否则yij=0 $y_{ij} = 1 否则 y_{ij}=0$ 。
假设这个线性的分类器的参数是：

W=[w1,w2⋯wC] $W = [ w_1,w_2 \cdots w_C ]$
那么对于学习到的一条数据的分类结果可以使用如下的公式来表示：

yi~=WTbi=[wT1bi,w

最低0.47元/天解锁文章

LIUHUANUCAS

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Efﬁcient Training of Very Deep Neural Networks for Supervised Hashing

1.介绍这篇文章主要说如果高效的训练深层的神经网络。对于现存的模型，由于一些限制，比如梯度消失的情况，只能限于训练一些比较浅层的网络。而且这种模型的效率并不高。所以作者就提出来一种可以高效训练深层网络的方法。具体的是：训练过程当中引入辅助变量，通过更新辅助变量，来达到某一层的局部最优解。通过实验发现，这种方法可以训练64个隐藏层，每层1024个节点的网络，而训练的时间在3个小时左右。2
复制链接

扫一扫