CPU性能公式看似简单,但一点儿也不好用,在学习并行处理于体系结构这门课时,这个公式要计算问题代入真的不容易,需要好好理解,所以做一个回顾。
例:假设某测试程序中FP指令(包括FSPSQR)的执行频度为25%,FP指令的平均CPI4.0,其它指令的平均CPI=20;FPSQR指令的执行频度为2%,FPSQR指令的平均CPI=20。假设有两种设计方案:一种是将FPSQR的CPI减为2,另一种是将所有FP的CPI减为2.5,试利用CPU性能公式比较这两种设计方案。
原系统的CPI为:
C
P
I
原
系
统
=
∑
i
=
1
N
(
C
P
I
i
∗
(
I
i
I
C
)
)
CPI原系统=\sum_{i=1}^N(CPI_i * \left(\frac{I_i} {IC}\right))
CPI原系统=i=1∑N(CPIi∗(ICIi))=4x25%+1.33x75%=2.0
方案一:将FPSQR的CPI减为2
CPI方案1=CPI原系统-2%CPI老+2%CPI新=CPI原系统-2%(CPI老-CPI新)=2.0-2%x(20-2)=1.64
总结:CPU性能公式看似简单,但一点儿也不好用