Angel-Eye: A Complete Design Flow for Mapping CNN onto Embedded FPGA阅读笔记

天使之眼是一种创新的CNN加速架构,旨在解决嵌入式FPGA上的高计算复杂度问题。通过dataquantization策略,将位宽降低到8位,精度损失微乎其微。编译工具能有效映射CNN模型到硬件,提高处理速度和能效。在ZynqXC7Z045平台上,相比于同类FPGA,性能提升6倍,能效提升5倍。在NVIDIA TK1和TX1平台上,天使之眼实现了目标检测,能效提升达16倍。
摘要由CSDN通过智能技术生成

天使之眼,一种可编程且灵活的CNN加速架构,以及data quantization策略和编译工具。

 

CNN的有着高计算量和存储能力,需要先简化再将其mapping到嵌入式fpga上。

为了解决CNN模型的高计算复杂度,data quantization策略有助于将位宽降到8位,精度损失可以忽略不计。该策略在给定位宽的每一层中找到最佳的半径点位置,之后再用额外的转换器来校正数据。

 

CALC指令,设置片上存储器中的数据块的地址和大小。

angle-eye分割矩阵,充分利用芯片上的缓冲区,外部内存用于保存网络的所有参数和每个层的结果。

提出了一种编译器来将网络描述符map到指令中。主要是按照一定的规则进行块分区,将外部内存空间用于处理器和CNN加速器之间的通信。

该编译工具可以有效地将某个CNN模型maping到硬件上。在ZynqXC7Z045平台上进行评估,在同一平台上Angel-Eye与同等级的FPGA运行相比,处理速度快了6倍,驱动效率高了5倍。使用NIVIDATK1和TX1平台进行比较。天使之眼实现了目标定位,并且能效提高了16倍。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值