Vivado HLS(High-level Synthesis)笔记六:数组优化

一. 数组分割

在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

  • 对于数组可以resource directive来明确告知HLS当前数组采用什么样的Memory(RAM、FIFO等)来实现,如果没有使用resource,Vivado HLS会自行决定采用单端口还是双端口(取决于哪种更好);
  • 数组最终会以Memory形式出现(RAM、ROM或者FIFO),如果是顶层函数中的形参就会以 相应Memory的接口呈现,包括读写地址、使能以及数据;如果数组是在内部,就会综合成内部的block RAM、LUTRAM、registers,这取决于优化设置;
  • HLS提供了三种对数组分割的方法——Block/Factor、Cyclic/Factor、Complete;
  • 在Block/Factor这种方式下,并不是越多的Block结果就越好,这取决于真实的数据流的需求;
  • 多维数组的维度确定;

二. 数组映射和重组

1. ARRAY_MAP

在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

  • 在C代码中如果有多个小数组,可以通过map将它们合并成一个大数组,而这个大数组会综合成block RAM或者UltraRAM,降低资源用量,Vivado HLS提供了横向和纵向两种方式做映射;
  • 对于Horizontal(水平方向)的映射,它减少了相应的Memory的资源,但对数据吞吐率并没有改善,因为Memory个数减少了,意味着读出数据的端口的个数也少了;
  • 对于Vertical(纵向)的映射,是将相应位置对应的元素做位拼接,所以最终数组长度仍然是原来数组中较长的数组长度,但是宽度发生了变化;
  • 可以将数组分割和映射(横向)结合,先通过PARTITION将数组分割成两个模块,再通过MAP将分割的部分合并,这样的好处在于减少资源的同时获得吞吐率的提升;

2. ARRAY_RESHAPE

在这里插入图片描述在这里插入图片描述在这里插入图片描述

  • ARRAY_RESHAPE是将纵向的ARRAY_MAP和ARRAY_PARTITION结合起来,从而降低了资源用量,提高了并行度;
  • ARRAY_SHAPE是针对同一个数组的;
  • ARRAY_MAP可以减少资源用量,但是不能提高数据吞吐率,ARRAY_RESHAPE一定程度上在资源和数据吞吐量之间取得了平衡;

3. 总结

在这里插入图片描述

三. 其他优化方法

1. 定义一个ROM

在这里插入图片描述在这里插入图片描述在这里插入图片描述

  • 可以通过关键字const+initial value的方法定义一个ROM,优势在于简单,不足之处在于如果长度过长时很容易出错且不易于代码管理;
  • 可以通过头文件,将ROM定义在头文件中;

2. 改变ROM输出latency

在这里插入图片描述在这里插入图片描述在这里插入图片描述

  • 默认情况下,ROM输出latency为2;
  • 增加ROM输出latency可以改善这条路径上的时序

3. Array Initialization

在这里插入图片描述在这里插入图片描述

  • HLS要将数组映射为Memory实现时,需要在前面加关键字static,这个static不仅保证了作为Memory实现,还保证了最终综合生成的RTL和C在行为上一致的(当数组有初始值时,无static时对Memory有相应操作时首先要初始化,需要一定时间),加了static后初始化的值已经被写进执行文件中;

4. 总结

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值