1 Fundamentals of Computer Design (Cont.)
- 影响成本的主要因素:时间(学习曲线)、产量、商品化程度(竞争等)。
- 经验公式:cost of die = f(die area ^ 4)。(andy:数据比较早,取alpha=3.0,第三版中alpha=4.0,好像是2001年的数据)
- 只有真实程序的执行时间才是对机器性能一致和可靠的测量指标。
- 测量时要注意流逝时间和CPU时间的差别,一般测量总是在操作系统上进行的。(andy:可以参考《深入理解计算机系统》中关于时间测量的章节)
- 评测程序的分类:
- real program
- kernels
- toy benchmarks
- synthetic benchmarks
- 性能报告的指导原则:可重现性
- 性能评测与比较要关注的方面:
- 程序选择
- 实验环境
- 测量指标(如何定义快慢)
- 数据合计方法
- 对执行时间进行规格化(normalize)后,应当用几何均值进行合计,这样将不受参考者选择不同的影响。
- 几何均值的问题:不直接反映执行时间
- 用几何均值计算的评测得分,可以通过改善最易优化的程序的性能来提高得分。如以下两种优化对得分的改善是相同的:
-
程序1,执行时间从2秒降低为1秒;
-
程序2,执行时间从10000秒降低为5000秒。
-
-
理想的方案:测量实际工作负载,给各个程序分配反映实际执行频率的权重。
-
如果无法得到权重,那么进行规格化,对各个程序一视同仁;
-
如果要进行规格化,那么最好先按照权重进行合计,再规格化。
-
(andy:成也权重,败也权重!没有适当的权重分配,会导致错误的结果!)
-
-
计算机设计量化方法的准则:Make the Common Case Fast / Amdahl's Law。
-
Speedup = Original execution time / Enhanced execution time
-
Speedup = 1 / (1 - Enhanced fraction + Enhanced fraction / Enhanced speedup) < 1 / (1 - Enhanced fraction)
-
CPU time = IC * CPI * cycle time
-
评估CPU时间各个影响因子:
-
clock time:难以估计,尤其在设计的前期。一般先设定目标频率,再评估关键路径的影响。很需要经验。
-
IC:编译器很关键。对于新ISA的设计,尽早开发编译器非常重要。获得数据的方法:
-
模拟器:速度是一个问题。影响速度的因素有:程序质量,目标机和宿主机的结构差异(andy: why?)。
-
execution-based monitoring:典型的instrument,执行时间为1.1-1.2倍。(andy:以前没有注意过, 了解一下吧)
-
-
CPI:和organization相关。CPI = Pipeline CPI + Memory system CPI。
-
-
局部性:大约10%的指令占总执行时间的90%。