ASPLOS'17论文导读——SC-DCNN: Highly-Scalable Deep Convolutional Neural Network using Stochastic Computing

最新推荐文章于 2022-12-27 21:39:58 发布

原创最新推荐文章于 2022-12-27 21:39:58 发布 · 4.9k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#硬件 #算法 #随机计算 #Stochastic #ASPLOS

异构加速/高性能计算同时被 2 个专栏收录

12 篇文章

订阅专栏

论文阅读笔记

11 篇文章

订阅专栏

探讨了SC-DCNN模型如何使用随机计算提高深度神经网络的可扩展性，包括随机计算的基本概念、乘法与加法的实现方式及其在神经网络中的应用。

今年去参加了ASPLOS 2017大会，这个会议总体来说我感觉偏系统和偏软一点，涉及硬件的相对少一些，对我这个喜欢算法以及硬件架构的菜鸟来说并不算非常契合。中间记录了几篇相对比较有趣的paper，今天简单写一篇。

SC-DCNN: Highly-Scalable Deep Convolutional Neural Network using Stochastic Computing
单位作者：
这里写图片描述

我们知道在神经网络计算中，最主要的计算就是乘加，本篇重点就是解释了什么是Stochastic Computing（随机计算），以及怎么用逻辑电路来实现Stochastic Computing。

Neural Network计算背景

这一块就不多说了，作者毕竟是在做一些早期研究，先解决有无问题，所以在MNIST这样规模的数据集上做的神经网络，可以转化为Stochastic Computing。（不过我要说一句，MNIST数据毕竟比较简单，用LENET这样规模的网络就可以搞定，实际上，其他研究中已经把LENET变成Binary的网络，识别准确率完全不成问题，因此可以用Stochastic Computing似乎也是顺理成章，但是其推广性就有待商榷了。事实上，在本次ASPLOS上，在本篇oral的提问环节，就有一个MM质疑了作者的Stochastic Computing只在这么小的网络上成功，完全不能说服大家是否在大网络上也可以采用，不然意义就不大了。我个人附议。）

这里写图片描述

Stochastic Computing定义与表示

Stochastic Computing (SC) is a paradigm that represents a probabilistic number by counting the number of ones in a bit-stream.

作者给出了两种形式的表示形式：

（1）可以表示[0，1]数据的unipolar encoding：

P (X = 1) = x

$P(X=1) = x$
比如0100110100就表示P(X = 1) = 4=10 = 0.4

（2）可以表示[-1，1]数据的bipolar encoding：

P (X = 1) = (x + 1) / 2,

$P(X = 1) = (x + 1)/2,$
所以，0.4 可以表示为1011011101, P(X = 1) = (0.4 + 1)/2 = 7/10

这样看似乎非常简单，但是有几点需要注意：

SC表示的数据不是唯一的，比如上面第一种，0100110100和1111000000表示都是0.4，因为SC只考虑bit stream中1的比例，而不考虑位置；
SC的数据不是固定的，而是通过stochastic number generators生成的，因此也更加增加了不确定性；
表示同一个数据可以用不同的bit length；

实际上，SC计算是有误差的，不精确的，其准确率受到stochastic number generators以及bit length的影响很大。

Stochastic Computing计算乘、加

乘法Multiplication.

一般的数字电路二进制fix point计算中，乘法的代价是远大于加法的，而SC的一个优势就是，乘法实现非常容易。

这里写图片描述

如上图，针对两种encoding，都只要非常简单的门电路就可以完成计算——unipolar是用AND，unipolar是用XNOR。（因为A和B是不确定的，所以计算A*B的结果也是不完全确定的，比如（a）情况，如果变成11110000 * 11001111的话，计算出来就是2/8。当然，结果还是在正确的范围之内的，所以要球NN可以容忍这样的计算误差，而NN也确实有这样的容错性，所以NN确实是SC很好的一个应用场景，希望以后可以在计算理论上再有突破）。

加法Addition.

加法要稍微复杂一点，但也比一般的逻辑运算单元简单很多。论文中介绍了以下四种加法器的实现。、
这里写图片描述

（a）OR门，这个是最简单的实现，但是相对来说误差较大，因为1 OR 1 = 1，没有办法捕捉进位的操作。
（b）MUX多路选择器，这个方法是最受欢迎的，实现也很简单。只要从输入中选取一个就可以了。原理如下：c = 2P(C = 1) - 1 = 2(1/2P(A = 1) + 1/2P(B = 1)) - 1 = 1/2[2P(A = 1) - 1 + 2P(B = 1) - 1] =
1/2(a+b).意思是说，反过来看，如果要计算a+b，是要把a和b的bipolar encoding中挑一个就可以了（即1/2P(A = 1) + 1/2P(B = 1)，这一句看起来像取平均值，但是如果有很多个输入A,B,C…，最后平均值就差不多用其中一个数值来代替），然后这个选出来的bipolar encoding所表示的c正好就是a+b的1/2，作者另外没有再讲，如何取消这个1/2的作用呢？MUX的结果算出的c再*2（<<1），得到a+b，在通过随机数生成器生成出对应的bipolar encoding。如果是3个数据a，b，d，就是3选1，然后表示出来的数据是1/3（a+b+d）,随机数生成部分只要最后做一次就可以了，理论上多少个数据相加都是一次。
（c）Approximate parallel counter (APC)，计数input的1个数，然后表示成一个binary number。
（d）把一个数据表示成两部分：符号部分和数值部分，是另外一种随机数的表示方法，

这里写图片描述