【论文笔记】二值化神经网络（Binarized Neural Network）

最新推荐文章于 2023-10-08 08:03:35 发布

lien0906

最新推荐文章于 2023-10-08 08:03:35 发布

阅读量928

点赞数 1

分类专栏：学术论文简读

5 篇文章 0 订阅

订阅专栏

文章的主要思想是通过二值化weights和activations，来提高NN的速度和减少其内存占用。

首先是如何对weights和activations进行二值化。如下图左，Binarization function 很简单，就是一个符号函数。但是作者就想了啊，符号函数不好进行梯度的反向传播啊，因此就把它近似成了右边的Htanh(x)的函数，这样在[-1,1]区间内导数就等于1。
这里写图片描述

那么除第一层（输入层）以外，每一层的前向传播过程如下：
这里写图片描述

首先权重 Wk 经过二值化，然后与上层二值化后的激活值 abk−1 相乘，再进项BatchNormalization得到这一层的激活值 ak ，由于BatchNorm的参数 θk 不是二值的，因此 ak 也不是二值的，我们需要再对它做二值化得到二值化后的激活值 abk 。

然后反向传播过程如下，要注意的是权重和激活值的更新并不是二值的，因为如果这样做的话误差会很大。
这里写图片描述

整个过程基本就是这样。还有一点，输入层的特征是没有进行二值化的，那怎么办呢？由于图像像素值分布在[0,255]之间，所以可以用8比特来表示，这样就能将输入的实值像素值变成二值化的编码了。整体BNN的流程如下，将乘法运算都变成了XNOR运算，可想而知其运算会很快。
这里写图片描述

实验结果如下，Baseline是32bit float的DNN方法，其他两个是在不同平台上运行的BNN方法，虚线表示训练的error rate，实线表示验证的error rate。可以看出BNN在训练时会比较慢，但是精度和DNN差不太多。
这里写图片描述

BNN的优势主要在于其测试速度快，占用内存小。与32bit DNN相比，它的内存占用减少了32倍，并且运行速度在GPU上快了7倍。It is amazing! 接下来的考虑就是能否在更复杂的数据库上得到和普通DNN差不多的精度，同时保持效率上的优势了。

关注

专栏目录