微电子学与计算机.pdf
微 电子学与计算机 2005年第22卷第 12期
浮点乘加部件中三操作数前导1预测算法的设计
梅小露1,2
(1中国科学院计算技术研究所,北京100080)(2中国科学院研究生院,北京 100039)
摘 要:提出了一种应用于高效浮点乘加部件的三操作数前导 I预测算法。高效浮点乘加部件需要实现三个操作
数的前导1预测(LAP)电路,传统的LOP算法不能直接处理三个操作数,通过间接方法实现又会增加关健路径延
时并增大电路面积。三操作数】0P算法是针对传统LAP算法的这一局限提出的,可以有效缩短前导1预测电路的
延时并减少面积,从而缩短整个乘加部件的延时。文章以龙芯2号通用CPU中浮点乘加部件的106位前导1预测
电路为例,分别采用传统LAP算法和三操作数LOP算法实现了电路,实脸结果表明,三操作数LAP算法比传统算
法延时能降低约16.67%,总面积减少约19.63%.
关健调:前导1预测,三操作数,乘加部件
中圈法分类号,TP332.2 文板标识码,A 文班编号:1000-7180(2005)12-016-05
AlgorithmicDesignofa3-OperandLeading-OnePrediction
LogicinFloating-PointMultiple-AddFusedUnits
MEIXiao-Lu"
(1InstituteofComputingTechnology,ChineseAcademyofSciences,Beijing100080)
(2GraduateSchoolofChineseAcademyofSciences,Beijing100039)
Abstract;Thispaperdescribesthedesignofa3-operandleading-oneprediction(LOP)logicforanenhancedfloating-
pointmultiply-addfusedunit.Thisenhancedmultiply-addfusedunitneedaLOPcircuittodealwith3operands.How-
ever,thetraditionalLOPcannotdealwith3operandsdirectly.Ifusinganindirectmethod,thetraditionalLAPwillin-
.easethede晰ofthecriticalpathandenlargethecircuitarea.Weimplementedthe106-bitleading-oneprediction
circuitisthemultiply-addfusedunitofGodson-2,usingthetraditionalLOPandtheproposedLOPrespectively.Com-
paredwiththedesignusingthetraditionalLOP,theoneusingproposedLOPcanreducethedelayofthecriticalpall妙
16.67%andreducethe~ 铸 19.63%approximately.
Keywords:Leading-oneprediction,3-operand,Multiply-addfused
1 引言 结构之一。采用这种结构,前导1预测电路处在整
浮点乘加部件是指完成D=A十B*C的功能部 个设计的关键路径上,因此,缩短前导1预测电路
件,它能够加快浮点运算的速度,提高运算精度。诸 的延时能够直接提高浮点乘加部件的性能。
如内积运算(向量点乘)、多项式计算等,采用乘加 乘加部件采用的前导1预测电路需要处理三
部件可以大幅度提高性能。目前,许多商用处理器 个操作数,然而传统的LOP算法不能直接处理三个
采用了浮点乘加部件,如Intel的Pen
1125

被折叠的 条评论
为什么被折叠?



