体系架构
4423
苦逼学生党
展开
-
Non-Blocking Simultaneous Multithreading:Embracing the Resiliency of Deep Neural Networks阅读
Paper title:Non-Blocking Simultaneous Multithreading:Embracing the Resiliency of Deep Neural Networks Publication:MACRO’20 这篇文章是提出了一个可以在运行时进行加速的方法,争对的是量化后的INT8矩阵,文中提出在模型的推理中,因为RELU的使用等原因,模型中常常会出现很多的零值,对INT8也会有高四位为零或第四位为零的情况,如下图: 在这些主流模型中,只有大约20%的运算是纯8bit8b原创 2020-11-22 22:19:30 · 178 阅读 · 0 评论 -
Look-Up Table based Energy Efficient Processing in Cache Support for Neural Network Acceleration 阅读
Look-Up Table based Energy Efficient Processing in Cache Support for Neural Network Acceleration 这篇文章主要讲的是在CPU的SRAM上运用PIM进行加速,基于的是查表技术。 SRAM的组织方式是一个CPU对应一个SRAM切片,一个切片中有4个体,一个体中有10个子体,一个子体中有8个子阵列,一个子阵列又能分为4个子阵列分区,如下所示: 整体的设计如下所示,在SRAM中分出一些地方存查找表条目,同时存储CB(c原创 2020-11-16 21:38:34 · 275 阅读 · 0 评论