用LUT来搭建乘法器

最新推荐文章于 2023-06-23 14:16:18 发布

apple^?

最新推荐文章于 2023-06-23 14:16:18 发布

阅读量2.7k

点赞数 1

分类专栏： zynq 电子电路

本文链接：https://blog.csdn.net/anpingbo/article/details/90552696

版权

本文探讨了如何利用Xilinx Ultrascale器件中的LUT资源设计乘法器，以应对CNN中乘法运算的需求。通过将乘法分解为小位宽的查找表操作和移位求和，可以灵活适应不同数据位宽，减少LUT资源的使用。文中还介绍了动态配置LUT内容的方法，以实现神经网络中权重参数的更新，从而提高算力。

摘要由CSDN通过智能技术生成

引言

卷积占据了CNN网络中绝大部分运算，进行乘法运算通常都是使用FPGA中的DSP，这样算力就受到了器件中DSP资源的限制。比如在zynq7000器件中，DSP资源就较少，神经网络的性能就无法得到提升。利用xilinx器件中LUT的结构特征，设计出的乘法器不但能灵活适应数据位宽，而且能最大限度降低LUT资源使用。

Xilinx ultrascale器件LUT结构

在这里简要介绍一下ultrascale系列器件中的LUT结构，有助于后边对乘法器设计思路的理解。CLB（configuratble logic block）是主要的资源模块，其包含了8个LUT，16个寄存器，carry逻辑，以及多路选通器等。其中LUT可以用作6输入1输出，或者两个5输入LUT，但是这两个LUT公用输入，具有不同输出。每个LUT输出可以连接到寄存器或者锁存器，或者从CLB输出。LUT可以用于64x1和32X2的分布式RAM，一个CLB内最大可以支持512X1大小的RAM。RAM的读写地址和输入的读写数据是共享的，数据通道可以使用x和I接口。LUT还可以配置用于4:1选通器，CLB最大能够支持到32:1的选通器。CLB中的carry逻辑含有异或门和产生进位的门，用于生成进位数据。