type有三个可选值,分别为block、cyclic和complete。
为便于说明,这里我们以一个数组长度为12的一维数组A[12]为例。
- 如果type为block,factor为4,意味着将A[12]分割为4个小的数组,这样每个数组的长度为12/4=3,同时每个数组中的元素是按顺序依次从原始数组中获取。
- 如果type为cyclic,factor为4,这仍是将数组分割为4个长度为3的小数组,每个数组中的元素是交织地从原始数组中获取。
- 如果type是complete,此时参数factor不起作用,可理解为将数组全部打散,可同时获取到12个元素,从而以寄存器方式实现。
三者的区别如下图所示。
block、cyclic和complete在下面这种描述方式下,最终的结果是一致的
#pragma HLS ARRAY_PARTITION variable=A block factor 12 dim=1
#pragma HLS ARRAY_PARTITION variable=A cyclic factor 12 dim=1
#pragma HLS ARRAY_PARTITION variable=A complete dim=1
如果factor不能被数组长度整除时会是怎样的结果呢?
假定上述案例中factor为5,最终将是5个数组,其中前4个数组长度为2,最后一个数组长度为4。
ARRAY_PARTITION还允许对不同维度进行分割,以二维数组A[6][4]为例,一维表示dim=1.二维表示dim=2
那么到底什么时候用block,什么时候用cyclic呢?本质上与数据流密切相关