什么！FPGA会碾压CPU和CPU？

最新推荐文章于 2024-09-12 10:44:41 发布

程老师讲FPGA

最新推荐文章于 2024-09-12 10:44:41 发布

阅读量109

点赞数 2

文章标签： fpga开发

本文链接：https://blog.csdn.net/2301_79732264/article/details/133637423

版权

本文探讨了FPGA作为可编程逻辑器件在ASIC领域的应用，强调其相较于CPU和GPU的三大优势：快速执行（无指令并行）、低延迟（流水线并行）以及高效处理通信密集型任务。FPGA的这些特性使其在大数据处理和流式计算中展现出优势。

摘要由CSDN通过智能技术生成

FPGA也叫做“现场可编程门阵列”，一种可重复编程器件，是在PAL(可编程逻辑阵列)、GAL(通用阵列逻辑)、CPLD(复杂可编程逻辑器件)等传统逻辑电路和门阵列的基础上发展起来的一种半定制电路，主要应用于ASIC领域。

FPGA常年来被用作专用芯片（ASIC）的小批量替代品，然而近年来在微软、百度等公司的数据中心大规模部署，以同时提供强大的计算能力和足够的灵活性。

优势1：快

CPU、GPU 都属于冯·诺依曼结构，指令译码执行、共享内存。FPGA 之所以比 CPU 甚至 GPU 能效高，本质上是无指令、无需共享内存的体系结构带来的优势。冯氏结构中，由于指令流的控制逻辑复杂，不可能有太多条独立的指令流，因此 GPU 使用 SIMD（单指令流多数据流）来让多个执行单元以同样的步调处理不同的数据，CPU 也支持 SIMD 指令。而 FPGA 每个逻辑单元的功能在重编程时就已经确定，不需要指令。

优势2：延迟性

FPGA 相比 GPU 的核心优势在于延迟，而FPGA 为什么比 GPU 的延迟低这么多？这本质上是体系结构的区别。FPGA 同时拥有流水线并行和数据并行，而 GPU 几乎只有数据并行（流水线深度受限）。

而 GPU 的数据并行方法是做 10 个计算单元，每个计算单元也在处理不同的数据包，然而所有的计算单元必须按照统一的步调，做相同的事情（SIMD，Single Instruction Multiple Data）。这就要求 10 个数据包必须一起输入、一起输出，输入输出的延迟增加了。当任务是逐个而非成批到达的时候，流水线并行比数据并行可实现更低的延迟。因此对流式计算的任务，FPGA 比 GPU 天生有延迟方面的优势。

优势3：通信密集型任务

从吞吐量上讲，FPGA 上的收发器可以直接接上 40 Gbps 甚至 100 Gbps 的网线，以线速处理任意大小的数据包；而 CPU 需要从网卡把数据包收上来才能处理，很多网卡是不能线速处理 64 字节的小数据包的。尽管可以通过插多块网卡来达到高性能，但 CPU 和主板支持的 PCIe 插槽数量往往有限，而且网卡、交换机本身也价格不菲。

虽然 GPU 也可以高性能处理数据包，但 GPU 是没有网口的，意味着需要首先把数据包由网卡收上来，再让 GPU 去做处理。这样吞吐量受到 CPU 和/或网卡的限制。GPU 本身的延迟就更不必说了。

程老师讲FPGA

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
什么！FPGA会碾压CPU和CPU？

是做 10 个计算单元，每个计算单元也在处理不同的数据包，然而所有的计算单元必须按照统一的步调，做相同的事情（SIMD，Single Instruction Multiple Data）。冯氏结构中，由于指令流的控制逻辑复杂，不可能有太多条独立的指令流，因此 GPU 使用 SIMD（单指令流多数据流）来让多个执行单元以同样的步调处理不同的数据，CPU 也支持 SIMD 指令。虽然 GPU 也可以高性能处理数据包，但 GPU 是没有网口的，意味着需要首先把数据包由网卡收上来，再让 GPU 去做处理。
复制链接

扫一扫