android二值化skan代码,XNOR-Net：二值化卷积神经网络-CSDN博客

本文介绍了神经网络模型压缩的重要性和应用，特别是二值化技术，如Binary Neural Networks (BNN)和XNOR-Net。BNN通过二值化权重简化计算，而XNOR-Net进一步将输入也二值化，利用XNOR操作加速计算。尽管精度可能有所下降，但压缩后的模型更适合移动端部署。文章还探讨了相关工作，如浅层网络、模型压缩和量化参数，并提供了一个未实现的XNOR-Net demo代码示例。

摘要由CSDN通过智能技术生成

Index

Introduction

Related Works

Binary Neural Networks

XNOR-Net

Conclusion

Introduction

神经网络模型的压缩是一个很有前景的方向。由于神经网络需要较大的计算量，目前来说，我们通常在服务器上对神经网络进行训练或是计算的。移动端的神经网络在断网的情况下就失去了作用。通过一些压缩神经网络的方法，我们能够缩小神经网络的规模，并且提高计算速度。这对于实现移动端人工智能来说很有意义。

本文基于< XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks>介绍了神经网络模型压缩的一些相关工作，以及二值化卷积神经网络BWN，还有XNOR-Net的工作原理。XNOR-Net的实现代码:[此处应有链接，等我写完初步的demo将会上传]。(由于Tensorflow暂时不支持bit操作，所以代码只作为研究用，并不能真正实现bit操作。)

Related Works

Shallow Networks浅层网络：用更浅的网络来表示训练好的网络。很多时候，神经网络会存在冗余的参数和层数，这个方法通过使用更浅的网络，达到相同的效果，减少参数加快计算。

Compressing pre-trained networks压缩训练好的模型：Deep Compression就是这样的方法。通过对模型参数进行剪枝，量化，哈夫曼编码等技巧，能够压缩模型。关于Deep Compression的介绍可以看我前几篇文章(文末有链接)。

Designing compact layers设计更简洁层: Residual layers就是一种压缩的手段。

Quantizing parameters量化参数：目前浮点数通常使用32bit表示，量化可以用更少的位数来表示参数，但是会损失一定精度。

Network binarization网络二值化：二值化是将网络完全使用+1, -1来表示，这样就可以用1bit来表示网络。Binary Weight Network 和XNOR-Net都是二值化的网络。网络二值化后，卷积可以表示为简单的加法减法，且可以大大减小计算时间。

Binary Neural Networks

Binary Neural Networks由Bengio团队在< BinaryNet: Training Deep Neural Networks with Weights and Activations Constrained to +1 or −1 >一文中提出。

其原理很简单：

BWN

其中I为Input输入，W为weight，B为二值化的weight，alpha为缩放因子。

由上式可知，一个kernel对输入进行卷积的结果，可以由二值化的weight对输入进行⊕后，再乘缩放因子得到。其中⊕表示没有乘法的卷积运算。