对嵌套循环的加速。
void ConvProcess(float temp[CHN_IN],float sum[CHN_OUT])
{
//#pragma HLS ARRAY_PARTITION variable=filter_buf complete dim=2
int i,j;
convprocess1:
for(j=0;j
void ConvProcess(float temp[CHN_IN],float sum[CHN_OUT])
{
#pragma HLS ARRAY_PARTITION variable=filter_buf complete dim=2
int i,j;
convprocess1:
for(j=0;j
使用这种优化方法的效果,综合时间较长。
换一个清晰一点的卷积思路
void ConvProcess(float temp[CHN_IN],float sum[CHN_OUT])
{
//#pragma HLS ARRAY_PARTITION