【HDL系列】进位旁边加法器原理与设计

一、进位旁边加法器

进位旁路加法器(Carry Skip Adder,CSA),也称Carry Bypass Adder。需要注意的是,CSA也是另外一种加法器——进位保存加法器(Carry Save Adder)的简称,关于这种加法器后期会介绍。

此前介绍了行波进位加法器RCA,第k位的进位Ck必须等待之前的Ck-1的结果才能计算出来,如下图进位c16必须等到前一级全加器的c15输出才可以计算,所以行波进位加法器的特点便是超长的进位传播链。

16比特RCA进位链示意图

进位旁边加法器的思想在于加速进位链的传播,在某种情况下,到达第i位的进位无需等待第i-1位进位。在16比特RCA中,最长的进位链为c0->c1->c2->…->c16,也就是说,每一位全加器都有进位,这条路径也是最长的关键路径。进位旁边加法器通过加入旁路逻辑来缩短这条最长路径,该旁路逻辑由2选1数据选择器,第x级进位和第y级进位和进位bypass信号组成。

4比特CSA结构

CSA结构如上,紫色部分为数据选择器,橙色部分为数据选择信号,数据来源为进位c0和第3个全加器的进位输出。

P3&P2&P1&P0=1c4=c0;进位c0直接传播至c4,而不需再经过4级全加器的延迟,这就是进位旁路加法器的核心。

为什么P3&P2&P1&P0=1时c0可以直接传播至c4?乍一看这个问题有点让人困扰。

先看c4的生成逻辑:

P3&P2&P1&P0=1时,则P3=P2=P1=P0=1,所以c4生成逻辑如下:

在介绍超前进位加法器中,我们定义了PG:

P是a与b异或的结果,只有a=0,b=1或者a=1,b=0时,P才可能等于1,而G=ab,所以只要P=1,G则一定为0,所以G3=G2=G1=G0=0。

最后结论与上述一致:P3&P2&P1&P0=1时,c4的生成逻辑最终变成c4=c0

二、进位旁路加法器关键路径与优化

将N比特加法器,以m比特为一组,分成N/m组,如下式16比特进位旁路加法器,N=16,m=4,共有4组,该16比特CSA由4比特CSA级联而成,其中4比特CSA4个全加器组成的Block进位逻辑Skip logic2选1数据选择器三部分组成。

16比特CSA结构

以上关键路径发生在:

  1. c0走第一级Block,经过4级全加器,进位从bit0到bit3生成c4。
  2. 中间进位经过bypass逻辑。
  3. 最后一级走Block逻辑,经过4级全加器,进位从bit12到bit15生成c16.

基于此结构通用的关键路径延迟公式为:

其中:

    Tsetup:A,B低位到第一级block的时间

    tcarry:每个进位传播Block中全加器产生进位的时间

    Tskip:进位通过skip逻辑的时间

    Tsum:从最后个进位到S输出的时间

可能在此处读者会有一个疑问,为什么最长的delay会是中间两级路径,如果加法器进位全部走Block逻辑,应该具有更长的延迟啊?其实走最长的路径,中间路径会被旁路,也就是执行0111_1111_1111_1111 + 0000_0000_0000_0001的情况。第一级进位产生后,中间两级被旁路,最后一级经过RCA进位链,也就是下图中红色描绘出的路径图。

16比特CSA关键路径图

三、进位旁路加法器Verilog设计

以下参数化cska(Carry Skip Adder, 为防止混淆取名cska)基于4比特cska设计,width可参数化定义为4的倍数,如20,24,32,64,128等。

默认16比特进位旁路加法器,由4个进位旁路加法器级联而成,每个进位旁路加法器中由4个全加器级联,且有进位旁路逻辑。

module cska #(width=16) (
    input  [width-1:0] op1,
    input  [width-1:0] op2,
    output [width-1:0] sum,
    output cout
);

wire [width>>2:0] c;
assign c[0] = 0;
assign cout = c[width>>2];

genvar i;
generate 
    for( i=0; i<width>>2; i=i+1) begin
        cska_4bit u_cska_4bit (
            .op1( op1[i*4+3:i*4] ),
            .op2( op2[i*4+3:i*4] ),
            .cin( c[i] ),
            .sum( sum[i*4+3:i*4] ),
            .cout( c[i+1])
        );
    end
endgenerate

endmodule

cska_4bit模块中进位链和进位旁路逻辑:

//full adder and p generator
genvar i;
for( i=0; i<width; i=i+1) begin
    full_adder_cska u_full_adder_cska(
        .a   ( op1[i]   ),
        .b   ( op2[i]   ),
        .cin ( c[i]     ),
        .cout( c[i+1]   ),
        .s   ( sum[i]   ),
        .p   ( p[i]     )
    );
end

//carry bypass
assign sel = p[0] & p[1] & p[2] & p[3];
assign cout = sel ? cin : c[width];

Verilog源码公众号回复004。

欢迎指正错误,更多阅读,关注“纸上谈芯”,不定期更新,共同学习:

  • 11
    点赞
  • 43
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
好的,实现64位进位加法器的全定制设计是一个比较复杂的任务,需要经过逻辑设计、电路设计、物理设计、时序分析、验证等多个步骤。以下是一种可能的实现流程: 1. 设计规格:明确电路功能和性能要求,制定设计规格书。对于64位进位加法器,规格书需要明确输入输出位数、运算精度、时钟频率、功耗、面积等指标。 2. 逻辑设计:使用HDL语言,如Verilog或VHDL,完成电路的逻辑设计。对于64位进位加法器,需要设计多个加法器模块,将它们串联起来实现64位的加法。 3. 电路设计:根据逻辑设计,进行电路的门级设计和电路图设计。在电路设计中,需要选择合适的器件和布局方案,以满足性能和面积的要求。 4. 物理设计:包括布局设计和布线设计。布局设计是将电路元件放置在芯片上的过程,布线设计是将这些元件连接起来的过程。在物理设计中,需要考虑布局和布线的优化,以满足时序和功耗的要求。 5. 时序分析:确定电路的时序特性,包括时钟频率、延迟和抖动等。在时序分析中,需要考虑逻辑电路和物理电路的时序特性,以保证电路的正确性和可靠性。 6. 设计验证:通过仿真和测试,验证设计是否满足规格书中的要求。在设计验证中,需要针对不同的测试用例进行仿真和测试,以保证电路的正确性和可靠性。 7. 版图生成:生成用于制造芯片的版图文件。在版图生成中,需要考虑制造工艺和成本等因素,以满足生产要求。 8. 制造:将版图发送给制造厂商进行制造。在制造过程中,需要进行光刻、蚀刻、沉积、掺杂等多个步骤,最终得到成品芯片。 以上是64位进位加法器全定制设计的主要流程。需要注意的是,全定制设计需要大量的人力和时间,而且成本较高。因此,它通常被用于对性能和功耗有高要求的电路设计,如高速通信芯片或微处理器等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值