转载：从底层结构开始学习FPGA（1）— 可配置逻辑块CLB（Configurable Logic Block）

最新推荐文章于 2024-07-17 14:35:42 发布

ZBigluck

最新推荐文章于 2024-07-17 14:35:42 发布

阅读量511

点赞数 3

分类专栏： FPGA底层结构文章标签： fpga开发学习 Powered by 金山文档

原文链接：https://blog.csdn.net/wuzhikaidetb/article/details/125175418

版权

FPGA底层结构专栏收录该内容

7 篇文章 20 订阅

订阅专栏

本文转载自CSDN博主「孤独的单刀」的原创文章，原文链接：https://blog.csdn.net/wuzhikaidetb/article/details/125175418

一、CLB概述

　　我们可以用 vivado 打开一个器件的 device 视图：

　　可以看到这些花里胡哨的五颜六色就分别代表了 FPGA 的底层硬件单元，主要有：可编程输入输出单元（IOB）、可编程逻辑单元（CLB）、时钟管理单元（MMCM/PLL）、BRAM、布线资源、内嵌的底层功能单元和内嵌专用硬件模块。其中最为主要的是可编程输出输出单元（IOB）、可编程逻辑单元（CLB）和布线资源。

　　而我们今天的主角可编程逻辑单元 CLB 则在上图中蓝色的若隐若现的位置，我们需要把它放大才能更好地观察：

　　蓝色框中的就是 CLB ，同时也可以发现，CLB 是由两种不同的元素组成，这个元素我们称之为 SLICE 。

　　如果把 FPGA 实现的电路看做是积木拼成的摩天大楼，那么 CLB 就是实现大楼的最基本元素 — 砖块。但是我们盖楼不可能只使用一种砖块，同样的为了实现各种功能的电路，我们也要把 CLB 切成了更小的块以便灵活组合实现更复杂的电路。

　　所以，CLB 实际上是四种基本元素的集合 —— 查找表LUT、进位链CARRY4、多路选择器Multiplexer以及存储单元FF。有了这四种基本元素后，我们就可以灵活组合实现各种时序逻辑和组合逻辑了。

二、SLICEM与SLICEL

　　一个 CLB 是由2个 SLICE 组成的，SLICE 根据其中的 LUT6 能实现的功能可以分为以下两种：

SLICEM（M：Memory）：其内部的 LUT 可以读也可以写，可以实现移位寄存器和 DRAM 等存储功能，还可以实现基本的查找表逻辑

SLICEL（L：Logic）：其内部的LUT只可以读，只能实现基本的查找表逻辑

　　CLB 的组成可以是上图的1个 SLICEM + 1个 SLICEL ，或者是2个 SLICEL ，但是不会是2个 SLICEM 。一般情况下，CLB 中比例 SLICEL : SLICEM = 2 : 1。

　　总结一下：1个 CLB = 2个 SLICE = 2 × ( 4个 LUT + 3个 MUX + 1个 CARRY4 + 8个 FF )，这就是CLB和SLICE的架构了。

三、查找表LUT

　　查找表（Look-up Table），本质上就是1个6输入，64深度的 ROM （ SLICEM 中的则是 RAM，因为可读）。通过将所有结果保存在其内部，使用时通过由输入构建的地址线对其进行查找，从而实现6输入的函数逻辑。

　　 📌比如，你要实现功能： y = a | b ^ c & d & e & f 。输入一共6个，可能的结果就是2的6次方64个，我把这64个结果全部存到 LUT 里，只要在使用的时候根据输入（也就是地址），拿出存在对应位置的结果就行了，这就是 LUT 实现各种函数的原理。

　　需要注意的是 SLICEM 中的查找表，除了读功能外还具备写功能，这就使得其内部的 LUT 由一个ROM变成了一个RAM，这也是其实现移位寄存器功能和分布式DRAM功能的原因。

3.1、移位寄存器SRL

　　SLICEM 可以在不使用触发器的条件下配置为32位移位寄存器（注意：只能左移）。这样，每个LUT可以将串行数据延迟1到32个时钟周期。移位输入D(LUT DI1脚)和移位输出Q31（LUT MC31脚）可以进行级联，以形成更大的移位寄存器。一个 SLICEM 的4个LUT6级联可以实现128个时钟周期的延时。多个 SLICEM 也可以进行组合。但 SLICEM 之间没有直接连接以形成更长的移位寄存器，在 LUT B/C/D处的MC31输出也没有。由此产生的可编程延迟可用于平衡数据 pipeline 的时间。

　　那这种 Shifter Register 可以用来做什么呢？Xilinx Guide 中也给出了回答：

Delay or latency compensation

Synchronous FIFO

content addressable memory （CAM）

3.2、分布式DRAM

　　SLICEM 中的 LUT 除了用作移位寄存器外，还可以被配置为 Distributed RAM（DRAM）。DRAM 的 write 是同步的，read 则是异步的。注意这里所说的同步异步不是跨时钟域的概念，而是类似于组合逻辑和时序逻辑的概念。可以理解为，write 是时序逻辑，只有在时钟有效沿且 write enable 为1时，数据才会被写入。而 read 则和时钟无关，只要地址有效，数据就会在当前周期输出。如果想要同步输出，我们可以自己在输出端加 register。

　　DRAM 的概念是相对于 BRAM 来说的，BRAM 是 FPGA 底层的固有的硬件单元，而 DRAM 则是使用 LUT 配置而成的，其位置和使用会稍微灵活一些，但是也有其他不足，两者的使用需要权衡。

　　DRAM 可以分为以下几种：