神经网络硬件加速
文章平均质量分 77
王_嘻嘻
这个作者很懒,什么都没留下…
展开
-
卷积神经网络硬件加速——INT8数据精度加速
上一专题已介绍了一种通用的卷积神经网络硬件加速方法——Supertile,本文将介绍一种特殊的硬件加速方案,一种INT8数据精度下的双倍算力提升方案。 目前大部分卷积神经网络模型的数据类型都是32-bits单精度浮点型,或者16-bits,但对于实际应用而言,99%和99.5%的网络准确率是没有区别的。所以,对于某些场景下,网络的数据精度使用INT8的数据类型就能较好的胜任工作。原创 2022-12-30 16:14:18 · 1646 阅读 · 3 评论 -
FPGA在卷积神经网络中的双倍算力应用——supertile技术分析
近年来随着智慧安防、生物医疗、汽车电子等强实时性应用开始快速兴起,各类AI模型层出不穷,神经网络结构日益复杂,所需算力也越来越大,这使得神经网络的硬件加速成为近几年的热点研究,不论是工业界还是学术届,AI的硬件加速方案层出不穷,但主要分为FPGA和ASIC两类。 FPGA不像ASIC,可以通过堆叠大量的计算单元来提升板卡算力,所以在FPGA上进行算力提升更受局限,本文将介绍一种基于Xilinx FPGA平台中DSP单元的supertile技术,该技术可以将DSP的计算效率提升两倍。原创 2022-12-14 22:37:09 · 1183 阅读 · 0 评论