
存算一体
文章平均质量分 66
Joejwu
努力学习,积极分享!
展开
-
Transpose转置SRAM(TSRAM)论文阅读简记
1、A 0.62mW Ultra-Low-Power Convolutional-NeuralNetwork Face-Recognition Processor and a CIS Integrated with Always-On Haar-Like Face Detectorisscc2017下图即为TSRAM的具体结构,添加了一个解耦MOS管,其源端、漏断分别连接到图中所示的蓝色与红色线;与正常SRAM一样采用行读取模式时,这两根线分别为H_RDWL与H_RDBL;此时进行读取,则H原创 2022-04-07 12:36:13 · 1115 阅读 · 0 评论 -
ISSCC2021 基于SRAM的存内计算16.3阅读记录
Note:因为只是笔者的阅读记录,所以内容组织上较为混乱!(如有错误,可评论指出!谢谢!)1、FoM指的是品质因子,Figure Of Merit一般来说,FOM值越大,性能就越高;本文中给出的计算公式FoM (IN-precision × W-precision × output-ratio × output-channel × EF/tAC)2、MACV即MAC value3、电容C = 电荷量Q/电压V;4、一个想法,结合SBCS部分的操作展开,这里为了得出每个原创 2021-11-12 11:18:10 · 1888 阅读 · 0 评论 -
2020ISSCC 基于SRAM的存内计算15.5阅读记录
Note:因为只是笔者的阅读记录,所以内容组织上较为混乱!1、2's complement此即二补数,是一种用二进制表示有号数的方法,也是一种将数字的正负号变号的方式,常在计算机科学中使用。在中国大陆地区通常称作补码。 一个数字的二补数就是将该数字作位反相计算(即一补数),再将结果加 1,即为该数字的二补数。在二补数系统中,一个负数就是用其对应正数的二补数来表示。2、ppt图里面的MACV字母下面的12~20代表的意思是,在HMACRB模块输出的值的位宽,当输入激活值与权值都是4bit的原创 2021-11-12 11:13:04 · 1604 阅读 · 0 评论 -
卷积神经网络通道剪枝算法小结
一、剪枝分类 目前常见的模型剪枝算法主要分成两类,即非结构化剪枝与结构化剪枝;在不少的神经网络加速器中已经应用了这些剪枝算法,早期常见的是非结构化剪枝,例如MIT的韩松组的前几年的相关工作中就有此类应用,但是在设计中采用的特殊数据格式和额外的编码/解码会带来额外的硬件开销; 这在基于传统系统架构的情况下,利用非结构化剪枝或者可以为NN模型的计算起到加速的作用,但是在存内计算架构下,基于ReRAM或SRAM这类紧耦合的电路结构中将很难去利用网络中存在的稀疏特征; ...原创 2021-10-10 15:58:33 · 7845 阅读 · 2 评论 -
基于SRAM或ReRAM的存算一体化架构及其常见稀疏方案
存算一体化架构设计以各种传统工艺(如SRAM、NorFlash)或新型忆阻器工艺(如FeRAM、ReRAM、PCM和MRAM)制作器件构建存储阵列,将神经网络权值参数直接存储在阵列内部,并以模拟信号的形式并行执行大规模矩阵乘法。以典型的存算一体化硬件架构为例,向量以电压形式驱动阵列字线(行),利用电压乘以电导(按照DNN的权值对忆阻器阻值进行编程)等于电流,并且电流在位线(列)自然汇聚相加的电流定律,一次读操作即可完成向量与矩阵的乘加操作。这种方法不但提高了矩阵乘法的并行度,而且避免了反...原创 2021-10-10 14:59:57 · 2341 阅读 · 0 评论