硬件加速最主要的效果就体现在对循环体的并行化处理,在vivado HLS中对for循环添加Directive时如果位置没选好的话,
对性能的影响还是非常大的。以下试验针对在for循环两种不同位置添加pipeline然后C综合后的结果进行对比,对比发现第一
种方法比第二种快约2*10的三次方倍。第二种方法比不加pipeline快约2*10的三次方倍。
结论:有pipeline比没pipeline好,在整个循环体外加pipeline比在循环体内加效果更好
方法1.延时最小的添加方法
C综合结果显示:
方法2.延时稍大的
C综合结果显示:
方法3.不加pipeline
C综合结果显示: