Xilinx Alveo系列FPGA加速卡软件开发入门

小强不吃菜

已于 2023-01-30 17:54:27 修改

阅读量3.3k

点赞数 1

分类专栏： Xilinx Alveo加速文章标签： fpga开发

于 2023-01-29 10:02:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BOBTOMY/article/details/128778229

版权

本文介绍了FPGA加速卡在异构计算中的应用，对比了FPGA与GPU的加速原理。通过详细解析Alveo系列FPGA加速卡的整体架构，展示了如何创建第一个工程，并对代码进行简介。文章还探讨了性能调优，利用vitis analyzer进行性能分析，强调了选择合适场景进行FPGA加速的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

背景

随着异构计算越来越火，FPGA加速卡在诸多领域的应用也越来越多。

FPGA加速卡与GPU加速卡加速原理完全不同。

GPU本质上是依靠海量的并行运算单元，提升整体的吞吐量，来吃尽内存带宽。

FPGA是通用的门阵列，按照数据结构和运算特点搭建专用运算单元，能够以更低功耗和时延实现高吞吐。

上一篇我们已经完成了环境搭建,本篇将主要介绍项目结构和工作原理

整体架构

使用GPU加速时，CPU发送数据和指令到GPU即可，无需考虑执行指令的运算核的设计，FPGA芯片运算核是需要开发的。如下图所示：主机通过PCIe连接FPGA加速卡。因此在Host端和Device端都有相应的代码。

传统的FPGA开发方式使用HDL语言，无法动态的修改FPGA内部的功能。FPGA加速的核心就是运算核更贴近数据，当数据结构或是处理流程变化，就需要修改运算核结构。如果每次替换运算核需要让服务器断电显然不现实，因此行业的普遍做法就是将芯片内分区，分为不可修改的静态区和可以修改的动态区。静态区内就是DMA、PCIe、DDR等基础的功能核,用户的运算核则部署到动态区中，通过AXI接口连接。

xilinx提供了Host端和Device端的数据交互，我们需要解决的Host的程序和Device的Kernel。

如下图所示，项目构建分为3个部分。Host端的程序、FPGA的Kernel、以及衔接Kernel和FPGA内部的Link。由于有link的存在，消除了一部分FPGA芯片规格差异,降低了Kernel的开发难度也可以在一定程度上与硬件解耦。

创建第一个工程

官方推荐的第一个DEMO工程就是向量加法，方便初学者快速掌握项目结构和运行原理。

创建工程首先需平台文件，我这里使用的是Alveo U50。常用的还有Alveo U200 ， Alveo U50

随便取个项目名字

导入官方提供的例程，推荐初学者选择这个，包括了HLS、OpenCL的使用以及任务并行化的使用。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。