论述：FPGA中并行计算的常规方法

最新推荐文章于 2025-03-11 12:13:20 发布

永恒的止水

最新推荐文章于 2025-03-11 12:13:20 发布

阅读量1.1w

点赞数 22

分类专栏：硬件逻辑开发文章标签：并行计算流水线计算交替计算

本文链接：https://blog.csdn.net/qq_38791897/article/details/89059900

版权

更新历史
20190411：

首次发布

用过FPGA的人应该都知道，在FPGA中，逻辑是并行地运行的，各个状态机同时都在工作，状态机之间可能会有信号交互，也可能毫无关系、各管各地工作。

这就给了我们一个灵感：如果我们要做的计算（例如级数求和）的规模很大，按顺序一步一步算的话，其时间开销是我们所无法忍受的，那么，我们是否可以想办法利用FPGA的并行特性，通过让计算并行地执行，来减小时间开销(或者说提高计算速度)呢？

基于这个灵感，就让我们看看，FPGA中并行计算的常规方法吧。

现在，我们要在FPGA中做这样一个计算：

对于上述要求完成的计算，看上去，在一个时钟周期内既完成乘法又完成加法是不可能的了。然而，如果我们这么做呢：

设计一个模块，模块的输入为时钟和参数A，输出为结果B。
该模块在每个时钟周期同时做"C=A×2"的计算和"B=C+1"的计算，其中，C为寄存器。

仿真该模块，就可以发现：

时钟周期	参数A(输入)	寄存器C	结果B(输出)
1	A1	…	…
2	A2	A1 $\times$ 2	…
3	A3	A2 $\times$ 2	A1 $\times$ 2 + 1
4	A4	A3 $\times$ 2	A2 $\times$ 2 + 1
5	A5	A4 $\times$ 2	A3 $\times$ 2 + 1
…	…	…	…

从上表可以看到：

虽然从输入A到输出B，相差了两个时钟周期，但是，每个时钟周期输出的B，都和两个时钟周期前输入的A相对应。即：等效地来看，相当于每个时钟周期，模块都完成了一次"B = A $\times$ 2 + 1"的计算！

哇塞，好神奇！这简直就是：

嗯，这种搞法，就是传说中的"流水线计算"，这里为其给出了一个不拘泥于FPGA中的情形的、更加普适的定义：

注："平均数据吞吐速率"指的是：在单位时间内，参数平均能够输入多少次，以及计算结果平均能够输出多少次。

流水线计算的结构如下图所示（"一条龙"式的结构）：

分析定义可知：