基于ultra96的物体识别——6.async& wait 多个硬件加速函数并行

上一节我们将所有硬件加速函数都整合在一起,免去了数据反复在DDR和PL传输,非常显著地提升了性能。我们的算法框图如下
在这里插入图片描述
本节我们将介绍一个SDS pragma,使得上边的数据流跟下边的数据流同时进行,进一步缩短计算延迟。
FAQ:
A:可不可以直接把上面的两个数据流放进一个函数,最后做&?
B:不能,因为FPGA对图像做处理是流处理,做&操作时要保证参与对应位置的两个像素同时出现在&的数据输入上,但是我们并不能保证上下两个数据流有相同的延迟,所以必须等全部数据都准备完才能进行&操作。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值