DPU(深度学习处理单元)
翻译自pg338-dpu
DPU是一个可以配置的计算引擎,用于优化卷积神经网络,广泛应用于加速深度学习推理算法,如VGG,Resnet,OLO,SSD,FPN等。DPU中并行利用度是配置的,可以根据目标硬件平台和应用进行选择。
DPU特点:
(1)一个用于访问配置和状态寄存器的AXI从接口
(2)一个用于访问指令的AXI主接口
(3)支持根据目标设备访问数据的可配置的64位或128位的AXI主接口,
(4)支持每个通道的单独配置
(5)支持可选的中断请求生成
DPU受vitis AI compiler产生的指令驱动。当目标神经网络,DPU硬件结构或者AXI数据宽度发生变化,相关的包含DPU指令的.xmodel文件必须重新产生
DPU位于PL端,并直接连接到处理系统PS中
DPU包括以下几部分:
(1)high-performance scheduler(2)instruction fetch unit(3)hybrid computing array(4)global memory pool
将DPU整合到工程中需要两种流