RTL可拓展设计：VerilogHDL实现2^N位宽无符号整数乘法器

从DC到深紫外

已于 2024-02-18 11:27:06 修改

阅读量1.4k

点赞数 19

分类专栏： FPGA技术分享文章标签： fpga开发

于 2024-02-10 19:00:40 首次发布

本文链接：https://blog.csdn.net/zhangfan2256/article/details/136091683

版权

FPGA技术分享专栏收录该内容

6 篇文章

订阅专栏

RTL可拓展设计：VerilogHDL实现2^N位宽无符号整数乘法器

参考资料
应用场景与设计目标
使用方法
设计原理
- 2位宽乘法器
- 2^N^位宽乘法器实现
补充设计：定点数乘法器

参考资料

我的开源RTL代码库

应用场景与设计目标

一般来说，FPGA中会带有一定数量的硬件乘法器。但是，很多情况下这些乘法器的数量并不足以应对大规模卷积的场景，很多场景也并不需要有如此高速的乘法器。因此，需要利用LUT资源来对不足的乘法器资源进行补充。

本设计着眼于这个应用场景，实现一种2^N（N大于等于1）位宽乘法器，用于执行无符号整数的乘法。

使用方法

文件构成

multiplier/unsigned/Makefile：用于测试的make脚本文件
multiplier/unsigned/multiplier_unsigned_b2.v：2位宽输入、4位宽输出的乘法器
multiplier/unsigned/multiplier_unsigned.v：2^N（N大于等于1）位宽输入、2^N+1（N大于等于1）位宽输出的乘法器
multiplier/unsigned/testbench.sv：测试激励文件
multiplier/td：安路测试工程（仅用于资源使用估计，不可直接下载运行）

主模块信号及其参数配置

主模块所在文件及其接口定义：

// multiplier/unsigned/multiplier_unsigned.v
module multiplier_unsigned #(
    parameter BITWIDTH_INPUT = 4
) (
    input clk,
    input rstn,

    input  [      BITWIDTH_INPUT - 1:0] a,
    input  [      BITWIDTH_INPUT - 1:0] b,
    output [(BITWIDTH_INPUT * 2) - 1:0] q
);

参数	备注
`BITWIDTH_INPUT`	定义输入位宽为2^N

方向	位宽	信号	备注
输入	1	`clk`	系统时钟信号
输入	1	`rstn`	同步复位信号，低有效
输入	`BITWIDTH_INPUT`	`a`	乘数
输入	`BITWIDTH_INPUT`	`b`	乘数
输出	`BITWIDTH_INPUT` * 2	`p`	结果数

信号时序

2位宽乘法器的时序图如下：

2位宽乘法器时序图

需要注意的是，复位信号是同步触发的，这有利于系统时序，降低毛刺出现的概率。

如图可见，p与a、b在同一个时钟周期之中，这样可以认为延迟是0个时钟周期。如果位宽为4，则延迟为2个时钟周期。如果位宽大于4，则延迟与位宽的关系为：

$DelayPeriod=log_2(BITWIDTH\_INPUT)*2-1$

如果想要确认这个结果，可以在安装Iverilog和GTKWave之后，在multiplier/文件夹内运行make进行仿真。

设计原理

2位宽乘法器

2位宽乘法器利用查表的方法实现。两个2位宽输入组成一个4位宽地址，一共是2⁴=16项：

// multiplier/unsigned/multiplier_unsigned_b2.v
module multiplier_unsigned_b2 (
    input clk,
    input rstn,

    input      [1:0] a,
    input      [1:0] b,
    output reg [3:0] q
);

  wire [4:0] res_rom[0:15];
  assign res_rom[4'b0000] = 4'b0000;
  assign res_rom[4'b0001] = 4'b0000;
  assign res_rom[4'b0010] = 4'b0000;
  assign res_rom[4'b0011] = 4'b0000;
  assign res_rom[4'b0100] = 4'b0000;
  assign res_rom[4'b0101] = 4'b0001;
  assign res_rom[4'b0110] = 4'b0010;
  assign res_rom[4'b0111] = 4'b0011;
  assign res_rom[4'b1000] = 4'b0000;
  assign res_rom[4'b1001] = 4'b0010;
  assign res_rom[4'b1010] = 4'b0100;
  assign res_rom[4'b1011] = 4'b0110;
  assign res_rom[4'b1100] = 4'b0000;
  assign res_rom[4'b1101] = 4'b0011;
  assign res_rom[4'b1110] = 4'b0110;
  assign res_rom[4'b1111] = 4'b1001;

  always @(posedge clk) begin
    if (!rstn) begin
      q <= 4'b0;
    end else begin
      q <= res_rom[{a, b}];
    end
  end

endmodule

这个实现也没什么好讲的，纯纯的穷举。

2^N位宽乘法器实现

先上代码：

module multiplier_unsigned #(
    parameter BITWIDTH_INPUT = 4
) (
    input clk,
    input rstn,

    input  [      BITWIDTH_INPUT - 1:0] a,
    input  [      BITWIDTH_INPUT - 1:0] b,
    output [(BITWIDTH_INPUT * 2) - 1:0] q
);
  generate
    if (BITWIDTH_INPUT > 2) begin : g_normal_mul

      reg [(BITWIDTH_INPUT * 2) - 1:0] q_buf;
      assign q = q_buf;

      wire [(BITWIDTH_INPUT / 2) - 1:0] a_h;
      wire [(BITWIDTH_INPUT / 2) - 1:0] a_l;
      wire [(BITWIDTH_INPUT / 2) - 1:0] b_h;
      wire [(BITWIDTH_INPUT / 2) - 1:0] b_l;

      assign a_h = a[BITWIDTH_INPUT-1:(BITWIDTH_INPUT/2)];
      assign a_l = a[(BITWIDTH_INPUT/2)-1:0];
      assign b_h = b[BITWIDTH_INPUT-1:(BITWIDTH_INPUT/2)];
      assign b_l = b[(BITWIDTH_INPUT/2)-1:0];

      // H*H
      wire [BITWIDTH_INPUT-1:0] q_bl_hh;
      multiplier_unsigned #(
          .BITWIDTH_INPUT(BITWIDTH_INPUT / 2)
      ) multiplier_unsigned_hh_inst (
          .clk (clk),
          .rstn(rstn),

          .a(a_h),
          .b(b_h),
          .q(q_bl_hh)
      );

      // H*L
      wire [BITWIDTH_INPUT-1:0] q_bl_hl;
      multiplier_unsigned #(
          .BITWIDTH_INPUT(BITWIDTH_INPUT / 2)
      ) multiplier_unsigned_hl_inst (
          .clk (clk),
          .rstn(rstn),

          .a(a_h),
          .b(b_l),
          .q(q_bl_hl)
      );

      // L*H
      wire [BITWIDTH_INPUT-1:0] q_bl_lh;
      multiplier_unsigned #(
          .BITWIDTH_INPUT(BITWIDTH_INPUT / 2)
      ) multiplier_unsigned_lh_inst (
          .clk (clk),
          .rstn(rstn),

          .a(a_l),
          .b(b_h),
          .q(q_bl_lh)
      );

      // L*L
      wire [BITWIDTH_INPUT-1:0] q_bl_ll;
      multiplier_unsigned #(
          .BITWIDTH_INPUT(BITWIDTH_INPUT / 2)
      ) multiplier_unsigned_ll_inst (
          .clk (clk),
          .rstn(rstn),

          .a(a_l),
          .b(b_l),
          .q(q_bl_ll)
      );

      // Output buffer adder 0
      reg [(BITWIDTH_INPUT * 2) - 1:0] q_buf_0;
      always @(posedge clk) begin
        if (!rstn) begin
          q_buf_0 <= {(2 * BITWIDTH_INPUT) {1'b0}};
        end else begin
          q_buf_0 <= {q_bl_hh, {(BITWIDTH_INPUT) {1'b0}}} + {q_bl_hl, {(BITWIDTH_INPUT / 2) {1'b0}}};
        end
      end

      // Output buffer adder 1
      reg [(BITWIDTH_INPUT * 2) - 1:0] q_buf_1;
      always @(posedge clk) begin
        if (!rstn) begin
          q_buf_1 <= {(2 * BITWIDTH_INPUT) {1'b0}};
        end else begin
          q_buf_1 <= {q_bl_lh, {(BITWIDTH_INPUT / 2) {1'b0}}} + q_bl_ll;
        end
      end

      // Output adder
      always @(posedge clk) begin
        if (!rstn) begin
          q_buf <= {(2 * BITWIDTH_INPUT) {1'b0}};
        end else begin
          q_buf <= q_buf_0 + q_buf_1;
        end
      end

    end else begin : g_b2_mul

      multiplier_unsigned_b2 multiplier_unsigned_b2_inst (
          .clk (clk),
          .rstn(rstn),

          .a(a),
          .b(b),
          .q(q)
      );

    end
  endgenerate

endmodule