Look-Up Table based Energy Efficient Processing in Cache Support for Neural Network Acceleration 阅读

最新推荐文章于 2023-11-11 21:42:25 发布

4423

最新推荐文章于 2023-11-11 21:42:25 发布

阅读量285

点赞数

分类专栏：体系架构 PIM 文章标签： ieee论文

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aqluheng/article/details/109730697

版权

本文探讨如何利用查表技术在CPU的SRAM中实现能量高效的神经网络加速。通过在SRAM中预留空间存储查找表条目和配置块，结合预充电控制器优化，减少了能耗并提升了运算速度。主要关注点在于乘法运算的加速，通过分类4位整数并使用BCE执行PIM指令。此外，文章还提到了矩阵乘法的加速机制和SRAM内的路由设计，以实现脉冲式计算。虽然表项数量有限，但这种方法展示了在SRAM中扩展计算能力的潜力。

摘要由CSDN通过智能技术生成

Look-Up Table based Energy Efficient Processing in Cache Support for Neural Network Acceleration

这篇文章主要讲的是在CPU的SRAM上运用PIM进行加速,基于的是查表技术。
SRAM的组织方式是一个CPU对应一个SRAM切片，一个切片中有4个体，一个体中有10个子体，一个子体中有8个子阵列，一个子阵列又能分为4个子阵列分区，如下所示：
SRAM组织方式
整体的设计如下所示，在SRAM中分出一些地方存查找表条目，同时存储CB(configure block)，使用BCE(bFree compute engine),来运行PIM指令。整体设计
下图(a)为一个原始的设计，将一个子阵列子分区的256列中的两列预留给查找表条目，但是这种设计不够省电。于是本文提出了设计(b),即添加一个预充电控制器,根据lut_en选择预充电部分,若为0即充上面的254行,为1即充下面的2行。然后两种的延迟以及能耗对比如©,看起来提升了很多。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。