AI芯片学习小结3-Vertical Data Streaming

AI芯片学习小结3-Vertical Data Streaming

文章:Accelerator Design for Convolutional Neural Network with Vertical Data Streaming
时间:2019

在传统的片上网络实现卷积神经网络的过程中,由于PE单元的个数有限,无法将ifmap一次性输入到PE阵列中,而是需要分成多批输入,因此数据的并行处理能力大幅降低,造成了卷积特征图时候的较长工作时间。此外,因为ofmap上的一个像素点由ifmap上的n*n个点与filter卷积获得,因此在分别计算相邻ofmap上的两点时,对应输入的ifmap会有一些重复的数据,并且滑动步长(stride)越小,重复越多。
在这里插入图片描述
在本文中,作者提出了In-depth addressing mode 以及对应的NoC架构Vertical streaming architecture。上图为in-depth在内存中的储存方式与传统的储存方式的对比。In-depth addressing mode是将处在同一位置的所有通道中的值储存在相邻的位置。可以看出,传统的储存方式是将几个通道的数据一次以此以此依次存储到memory,而本文提出的方式是将几个通道的值交错存储。看到这里也大致可以猜到,这样存储的好处就是只需寻址一次便可以这个数值用于所有其的卷积计算中,而不是在计

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值