目录
基于FPGA的目标检测系统的设计与实现
深度学习硬件加速技术研究现状
随着各种深度学习算法的蓬勃发展,对处理平台的性能要求也就越来越高,具
有高速度、低功耗、高灵活度等特点的平台,将是各类深度学习算法落地的重要基
石。目前,在深度学习算法硬件加速研究方面,主流的硬件平台有3种[16]:GPU、
ASIC与FPGA。
GPU起初是用于视频图像任务的处理,擅长大量数据的多内核并行处理,具
有高计算力、高带宽与高并行性等特点,并且具有软件可编程性且支持多种软件库,
能够非常灵活的处理各种任务,尤其是简单的重复性任务。而深度学习算法通常需
要进行反复且规律性的计算,计算过程较为简单但计算量尤为庞大,因此,GPU被
大量应用在深度学习领域的模型训练方面。随着人工智能技术的应用深入到人们
生活的方方面面,各大企业都竞相推出了多款用于深度学习加速的高性能GPU芯
片。2017年