最近做了CNN的卷积层和LS-SVM在ZYNQ7020上的实现。除了输入是由ARM通过AXI总线传输,算法的主要部分都是由PL部分(FPGA)实现的。当然这只是入门的尝试,对于一个深度学习算法,如何在硬件上实现效率最高,还需要进一步的验证(在SOC架构中对算法进行划分还是直接采用高端FPGA实现)。
最开始做的是卷积层的实现,通过学习的例程,使我对整个开发流程有了初步的认识。随着自己在自己板子上的实现,对于其中存在的很多没有明说的关键细节,有了更多的积累。最后,开发的流程和思想由这些细节串联成一个整体。而后来的LS-SVM