并行计算机系统结构第1章
1.2.2技术进展[11] 并行机的进展主要得益于高集成度的微处理器芯片和大容量的存储器芯片;而并行机真正与普通商品工艺技术相结合才产生了根本的变化。 1.硬件进展 硬件方面的进展包括(微)处理器芯、存储器芯片、磁盘和磁带以及通信网络等。 2. 器件发展的特点 (1) 集成度迅速提高 目前水平:每个芯片有1010个晶体管 单芯片内可以做大于1Gb存储器, 单芯片内可以集成2个CPU+全部Cache 每4~5年提高一个数量级 还远没有达到集成度的极限 问题? 如何利用器件集成度的提高,不断改进计算机系统的性能:例如,有更多指令并行执行,采用更深的流水线,集成更多的Cache等 2. 器件发展的特点 (1) 集成度迅速提高 目前水平:每个芯片有1010个晶体管 单芯片内可以做大于1Gb存储器, 单芯片内可以集成2个CPU+全部Cache 每4~5年提高一个数量级 还远没有达到集成度的极限 问题? 如何利用器件集成度的提高,不断改进计算机系统的性能:例如,有更多指令并行执行,采用更深的流水线,集成更多的Cache等 (2) 提高速度空间不大 目前CPU主频已经到达6GHz, 时钟周期0. 16ns,门延迟小于0.01ns 极限速度30万公里/秒/2=1.5mm/0.01ns 信号在导体中传递速度小于光速的50%。 Pentium芯片面积500mm2,即23mm ? 23mm 器件速度提高的余地已经很小,将来提高处理 机速度更多依靠系统结构的发展 可从系统结构的两个方面提高处理机速度: 提高IPC,从目前的2左右提高到8以上, 采用更深度的流水线和并行处理技术 (3) 价格直线下降 CPU芯片的价格每年要下降>80% (4) 可靠性越来越高 芯片可靠性达到108小时,连续使用1万年以上 3. 器件种类 通用片:逻辑关系确定 大批量生产,如:CPU、存储器、寄存器… 现场片:可以一次或多次改写逻辑关系 如:PLD、PAL、PROM、EPROM、FPGA… 用户片:各种专用芯片 需要单独设计和生产。 半用户片:门阵列片等 标准的门电路,前几到工序已经完成; 根据用户需要确定最终连线。 4. 器件发展对计算机组成技术的影响 器件速度与处理机工作主频 1955年第一台大型机 IBM704 机,主频12us, 1976年巨型向量计算机CRAY,主频12.5ns, 目前,Pentium4 的主频已经达到 3GHz 器件速度与指令执行时间 46年来器件速度提高104,指令速度快108以上 系统结构和组成技术的作用 器件速度提高减慢, 处理机主频提高速度减缓 指令执行速度的提高基本保持不变(摩尔定理) 1.4.3 应用发展的影响 1. 应用需求 高结构化数值计算:气象模型,流体流动,有限元分析。 非结构化的数值计算:蒙特卡洛模拟, 稀疏矩阵。 实时多因素问题:语音识别,图象处理, 计算机视觉。 海量存储和输入输出密集问题:数据库, 事务处理。 图形学和设计系统:计算机辅助设计。 2. 三个时期 通用计算机:主要是通用科学计算 专用计算机:科学计算、事务处理、实时控制 高性能通用机:满足多种需求 目前又开始多种专用处理机的研制 3. 两个发展趋势 维持价格不变,利用VLSI技术等,提高性能 性能基本不变,价格迅速下降 一般先推出中间机型,然后再分别向高端和低端两个方向发展 4. 三种设计思想 最高性能价格比:商用机。主要发展方向 最高性能:国家安全需要,科技发展需要 例如:银河计算机、神州计算机、… 最低价格:家用学习机等 1.4.4 改进算法的影响 在多个层次上,算法影响着系统结构,例如: 快速乘法、除法、开平方等的实现: 记分板算法、Tomasulo算法提高指令级并行性 消除名字相关、数据相关、控制相关的算法 有些问题,如果算法上有突破,不需要高性能的系统结构,而在普通系统上就能得到解决。 许多算法还有改进的余地,通过算法的研究能够大幅度提高系统的性能。 系统结构设计者要研究算法,应该研究一系列算法,使所有同类问题都能很好解决。 本章重点: 1. 计算机系统的层次结构 2. 计算机系统结构的定义及研究内容 4. 冯 · 诺依曼结构及其发展 5. 透明性、系列机、兼容性等概念 6. 了解计算机系统的分类方法 * * * * * * 三总线结构 CPU 主存 PCI桥 I/O设备 I/O设备 处理机总线 100MHz 32或64位 ISA / EISA