Look-Up Table based Energy Efficient Processing in Cache Support for Neural Network Acceleration 阅读

本文探讨如何利用查表技术在CPU的SRAM中实现能量高效的神经网络加速。通过在SRAM中预留空间存储查找表条目和配置块,结合预充电控制器优化,减少了能耗并提升了运算速度。主要关注点在于乘法运算的加速,通过分类4位整数并使用BCE执行PIM指令。此外,文章还提到了矩阵乘法的加速机制和SRAM内的路由设计,以实现脉冲式计算。虽然表项数量有限,但这种方法展示了在SRAM中扩展计算能力的潜力。
摘要由CSDN通过智能技术生成

Look-Up Table based Energy Efficient Processing in Cache Support for Neural Network Acceleration

这篇文章主要讲的是在CPU的SRAM上运用PIM进行加速,基于的是查表技术。
SRAM的组织方式是一个CPU对应一个SRAM切片,一个切片中有4个体,一个体中有10个子体,一个子体中有8个子阵列,一个子阵列又能分为4个子阵列分区,如下所示:
SRAM组织方式
整体的设计如下所示,在SRAM中分出一些地方存查找表条目,同时存储CB(configure block),使用BCE(bFree compute engine),来运行PIM指令。整体设计
下图(a)为一个原始的设计,将一个子阵列子分区的256列中的两列预留给查找表条目,但是这种设计不够省电。于是本文提出了设计(b),即添加一个预充电控制器,根据lut_en选择预充电部分,若为0即充上面的254行,为1即充下面的2行。然后两种的延迟以及能耗对比如©,看起来提升了很多。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值