🎉本节任务:
编写程序实现FPGA并行KerneI计算的代码,测量带宽,与单Kernel程序对比
理解生产者一消费者架构的概念,学会将复杂计算任务分解为多个并行Kernel
作业:修改FPGA向量加法程序,实现Load-Compute-Store三KerneI程序。
🎉实验要求:
修改vecAdd代码,使用三个Kernel实现Load-Compute-Store架构,测量修改后性能;
撰写并提交实验报告四。
🎉实验PPT:
✅✅✅本门课程个人最终得分98,因此提供个人的实验报告作为参考。报告附录里面含有代码
下面是实验包告的部分展示:
完整实验报告点击下载🎉:智能计算系统实验4-多线程计算
点击博客上方专栏,可以查看本门课程的其他实验。