转载：从底层结构开始学习FPGA（2）— LUT查找表

最新推荐文章于 2024-07-14 15:06:03 发布

ZBigluck

最新推荐文章于 2024-07-14 15:06:03 发布

阅读量606

点赞数 4

分类专栏： FPGA底层结构文章标签： fpga开发学习 Powered by 金山文档

原文链接：https://blog.csdn.net/wuzhikaidetb/article/details/124642077

版权

FPGA底层结构专栏收录该内容

7 篇文章 20 订阅

订阅专栏

本文转载自CSDN博主「孤独的单刀」的原创文章，原文链接：https://blog.csdn.net/wuzhikaidetb/article/details/124642077

一、概述

　　记得刚接触 FPGA 的时候，总能看见类似这样的一句话—— FPGA 是基于查找表 LUT 的可编程逻辑器件。FPGA 常常被人比作“数字积木”，就是因为底层资源的丰富和灵活，要做任何“ 玩具 ”（项目要实现的功能，也可以说是电路），只需要设计好“图纸”（RTL），即可使用积木（FPGA 丰富的底层逻辑资源，如LUT、FF、MUX 等等）来实现。

　　在最底层，可配置逻辑模块有着两种最基本的部件：触发器和查找表（LUT）。这很重要，因为各种 FPGA 家族之所以各不相同，就是因为触发器和查找表组合的方式不同。LUT 查找表可以算其中相当重要的一个底层资源，通常用来实现所需的组合逻辑功能。而 FF 触发器则一般用来实现时序逻辑功能。

　　在7系列器件之前的器件多使用LUT4，即4输入LUT；而7系列后则多使用LUT6，即6输入LUT。

二、基本原理

　　LUT（look up table），即查找表，其原理其实也就是一个一个查找表，根据输入去找到相应位置的信号，然后做输出。说白了就好像一个小容量的ROM，把输入当作地址信号，对LUT里面预存的内容进行寻址。

　　7系列的 FPGA 的LUT有6个输入端口（I0~I5），然后有两个输出端口（O5, O6），如下所示：

　　6个输入端口一共有2^6 = 64种输入，所以可以将一个LUT6视为一个容量为64的ROM，其中存储的是64种不同的逻辑运算的结果，而不同的输入则组成了ROM的地址线。所以逻辑运算的实现实际上就是对LUT6的一个译码过程。

三、LUT与传统逻辑门电路

　　假设有这样一个逻辑： y = a0 & a1 & a2 & a3 & a4 & a5。

　　这个例子比较简单，其只在所有输入均为1的情况下输出才为1，其他情况输出均为0。将其写成Verilog的形式：

module test
(
    input    a0,
    input    a1,
    input    a2,
    input    a3,
    input    a4,
    input    a5,
    output    y
);
 
    assign y = a0 & a1 & a2 & a3 & a4 & a5;
 
endmodule

　　用 Vivado analysis 一下，看看分析出来的门级电路是什么样子的：

　　很显然，就是5个与门实现6输入相与的功能。如果 FPGA 中没有LUT这种结构，而是由不同的逻辑门组成，那么实现上述逻辑功能则最终会映射到5个与门。可是随着设计的复杂化，仅仅使用与门显然是无法满足设计需求的，我们还需要其他逻辑门，如或门、非门、异或门等。当然这些逻辑门都可以由数个与非门或者或非门实现，但是这无疑需要进行一个译码过程以及会造成资源的浪费。

　　而LUT将所有可能的逻辑值均存起来，用的时候再查表就方便多了。我们不需要知道这个电路会映射成什么样的、多少个逻辑门，我们只需要根据输入直接查表找对应的输出就行了。这大大提高了灵活性以及资源的利用效率。

　　此外，采用传统逻辑门电路实现逻辑关系的方法也存在一些严重的缺点：

（1）输入变量从通过逻辑电路到输出变量，存在一定的延迟，该延迟的大小和逻辑电路的复杂程度密切相关。逻辑电路越复杂，延迟越大，因此，延迟是不确定的；

（2）延时的倒数是频率，频率和时序电路的工作速率密切相关。因为延迟不确定，所以频率也不确定，这将严重影响整个电路的工作性能；

（3）逻辑电路的复杂程度和输入逻辑变量的个数、逻辑门的个数有关。因此输入逻辑变量越多，逻辑电路就越复杂。

　　说回正题，我们把上述代码再综合（synthesis）一下，看看最终的电路实现是什么样子的：

　　和料想的一样，就是综合出来一个LUT6。下图是LUT6的源语形式（也可以说是网表形式），其中的INIT例化的值即是载入的64个输入的对应值。

　　我们把上述代码的网表文件导出来看看（我只截取了LUT6部分）：

　　注意INIT的值，64bit中只有最高位为1，其他63位为0。也就是说，只有当6输入均为1时输出才为1，其他输入情况下输出均为0。与料想的逻辑值一致，也就是说INIT载入的是要查表的值，也就是要写入LUT这个小ROM的初始值。

　　再把上述代码布局布线（implementation）一下，看看映射到 FPGA 芯片的具体实现是什么样子：

　　很简单，就是6个输入+1个输出+1个LUT6，LUT6的结构与理论一致。注意：LUT6中的O5输出并没有使用。

四、LUT6的使用　　

　　再看下LUT6的结构：

　　其实1个LUT6是由2个LUT5 + 1个MUX组成的。2个LUT5共用5个输入，其中一个LUT5的输出直接连接到O5；同时该输出也连接到MUX，另一个LUT5的输出也连接到MUX，而输入I5则作为MUX的选择控制信号。

当LUT6作为6输入查找表使用时，则其中一个LUT5存放I5为1时的结果，而另一个LUT5则存放I5为0时的结果，此时O5输出不使用。而O6输出则通过I5的控制来实现6输入的查找结果。

当LUT6作为2个5输入查找表使用时，则将I5固定为1，则其中一个LUT5实现逻辑功能y1，并固定通过MUX到O6输出，而另一个LU5则实现逻辑功能y2，并直接通过O5输出

举例如下：
逻辑 y1 = a0 & a1 & a2 & a3 & a4；
逻辑 y2 = a0 | a1 | a2 | a3 | a4；

　　Verilog如下：

module test
(
    input      a0,
    input      a1,
    input      a2,
    input      a3,
    input      a4,
    output     y1,
    output     y2
    
);
 
    assign y1 = a0 & a1 & a2 & a3 & a4 ;
    assign y2 = a0 | a1 | a2 | a3 | a4 ;
 
endmodule

　　vivado 综合的电路：