论文阅读
国内外相关论文的阅读笔记
FPGA硅农
数字IC设计,FPGA开发
展开
-
论文阅读-Fast Algorithms for Convolutional Neural Networks
TitleFast Algorithms for Convolutional Neural Networks未完待续…原创 2020-11-04 16:19:12 · 1057 阅读 · 0 评论 -
论文阅读-LEARNED STEP SIZE QUANTIZATION
一.TitleLEARNED STEP SIZE QUANTIZATION二.Abstract&Introductionwhy?近年来,神经网络作为一种许多革命性技术的组成部分开始崭露头角,比如图像识别、语音识别以及自动驾驶等。但是,要利用好这一技术并大规模应用需要开发者有一个系统性的视角,即要兼顾网络的性能、吞吐率、能效以及紧凑程度。现在很多研究者都致力于在保持网络精度的同时,用低精度的数据去表示权重和激活,这种方法使得模型的大小以及计算量大大降低。因此,如何在降低精度的同时尽可能保持网络原创 2020-10-15 19:59:34 · 1817 阅读 · 4 评论 -
论文阅读6:MeliusNet
一.TitleMeliusNet: Can Binary Neural Networks Achieve MobileNet-level Accuracy?二.Abstract&Introductionwhy?深度神经网络在众多机器学习领域取得了巨大的成功,人们也在不断设计更大、更复杂的网络以追求更高的准确率,然而,深度神经网络巨大的参数数目和计算量阻止了其在移动和嵌入式设备上的应用,针对这一问题,人们做了许多工作来减少模型大小、加速推理速度,主要可以分为三个研究方向:一是模型剪枝技术,二是原创 2020-10-12 15:35:19 · 870 阅读 · 0 评论 -
论文阅读笔记5-An Asynchronous Energy-Efficient CNN Accelerator with Reconfigurable Architecture
一、TitleAn Asynchronous Energy-Efficient CNN Acceleratorwith Reconfigurable Architecture二、Abstract & Introductionwhy?卷积神经网络在计算机视觉领域被广泛使用,并且展示了它在图像分类、目标检测以及视频监控等方面的巨大优势。传统上 ,卷积神经网络的推断过程在CPU和GPU上完成,但是,CPU计算资源有限,并行度不够,而GPU虽然在计算方面强于CPU,但是GPU有着极高的功耗,ASI原创 2020-10-10 21:30:26 · 760 阅读 · 0 评论 -
论文阅读4:ShiDianNao
一、TitleShiDianNao: Shifting Vision Processing Closer to the Sensor二、Abstractwhy?尽管近年来神经网络在很多领域都表现出色,但是神经网络的能效和性能都受限于访存,这在计算机视觉领域主要是指CNN(卷积神经网络),因此,如果要进行CNN在边缘应用中的推广,这是一个必须解决的问题。how?本文中,作者利用卷积神经网络权重共享的特性,提出了一个叫做ShiDianNao的加速器,它充分进行了数据复用,消除了对DRAM的访问,并且原创 2020-10-09 13:59:49 · 1015 阅读 · 0 评论 -
论文阅读3:INT8量化训练
一、Title二、Abstract三、Methods四、Experiment原创 2020-09-28 12:47:28 · 2231 阅读 · 0 评论 -
论文阅读笔记2:Eyeriss
TitleEyeriss: An Energy-Efficient Reconfigurable Accelerator for Deep ConvolutionalNeural NetworksAbstractwhy?AI算法近年来取得了绝大的成功,但是它也给AI算法的硬件部署带来了吞吐率和能效方面的挑战。由于绝大多数AI算法的计算都需要大量数据的搬运(片上数据传输and片外数据传输),而这些数据的搬运都是十分耗费功率的,因此,存储便成了加速器中一个特别需要考虑的因素。how?作者为了缓解这原创 2020-09-26 12:49:03 · 8650 阅读 · 5 评论 -
论文阅读笔记-DEEP COMPRESSION
本次阅读的论文是斯坦福大学韩松的博士论文《DEEP COMPRESSION: COMPRESSING DEEP NEURALNETWORKS WITH PRUNING, TRAINED QUANTIZATIONAND HUFFMAN CODING》一、AbstractWhy?近年来,神经网络在人们实际生活中取得了巨大成功,但是,神经网络这类算法存在着一个鲜明的特点,它是一种计算密集型和存储密集型的算法,这就导致神经网络很难在嵌入式设备上部署,本文就旨在解决这一个限制。How?作者在文章中提出了原创 2020-09-20 20:35:23 · 561 阅读 · 0 评论