- 博客(2)
- 收藏
- 关注
翻译 OpenCL优化方法-消除访问内存数组引起的循环依赖关系
消除访问内存数组引起的循环依赖关系在单个工作项内核中包含ivdep pragma,可以声明对内存数组的访问不会导致循环依赖。在编译期间,OpenCL离线编译器的英特尔FPGA SDK创建了可确保加载和存储指令在依赖关系约束下运行的硬件。依赖约束的一个例子是依赖的加载和存储指令必须按顺序执行。ivdep pragma的存在指示离线编译器移除循环中加载和存储指令之间的额外硬件,此循环在内核代码中紧
2017-08-01 20:03:28 957
翻译 OpenCL优化方法-Single Work-Item Kernel的良好设计实践
Single Work-Item Kernel的良好设计实践如果您的OpenCL内核包含循环结构,请遵循英特尔推荐的指导方针,以允许OpenCL Offline Compiler的Intel FPGA SDK可以针对内核进行有效分析。指导离线编译器在循环中执行流水线并行执行时,结构良好的循环尤其重要。1、避免指针别名混淆使用在指针参数中尽可能插入restrict关键字。在指针参
2017-08-01 20:01:21 869
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人