- 题目:Towards Higher Performance and Robust Compilation for CGRA Modulo Scheduling
- 时间:2020
- 期刊:IEEE Transactions on Parallel and Distributed System
- 研究机构:交大绳伟光
1 introduction & abstract
- 需求:在可接受的编译时间内有效地将循环部署到CGRAs上
- 难点:CGRA现有计算和缓存资源不足,循环代码量大且不规则
现有研究的主要问题:
- 缓存资源利用不足
- 集成映射策略编译时间长
- 没有考虑互连和计算资源的约束
本篇论文的主要贡献:
- 将CGRA模调度问题分解为时间和空间映射问题
- 对于时间映射问题,我们提供了一个全面系统的映射流程,包括一个强大的缓冲区分配算法,以及高效的互连和计算约束求解算法。
- 针对空间映射问题,我们开发了一种快速稳定的空间映射算法,该算法具有回溯和重排序机制。
- 题目:Decoupling the Multi-rate Dataflow Execution in Coarse-Grained Reconfigurable Array
- 时间:2020
- 会议:ISCAS
- 研究机构:交大景乃锋
1 introduction & abstract
- CGRA的优势:可重构处理元件和互连,采用数据流驱动的执行,不需要程序计数器PC和寄存器文件,从而消除指令调度和数据移动的开销
本篇论文的主要贡献:
提出了一种统一的存储结构来解耦多速率数据流,以实现解耦并行执行
比如说对于下图(a),可以拆解成两个数据流,但是二者速度不一致,需要中间插入buffer
For imbalanced paths, a simple alternative solution is to insert buffers into the shorter path for retiming
但是对于CGRA,每次部署的算法不同,执行速度和需要的buffer长度不同,这就需要可配置的存储结构,这就是本文提出的decoupled storage element(DSE)