中山大学计算机体系结构复习笔记
---------------------------------------------------------------------------------------------------------------
Ch 1
摩尔定律(芯片技术)当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。
安德厚定律
计算机分类的依据:
现代计算机应用新的分类:
个人移动设备(Personal Mobile Device (PMD):智能手机、平板电脑等,强调高效和实时性;
桌面计算(Desktop Computing):PC业务,强调性价比(price performance);
服务器:强调可用性(availability)、规模化/可扩展性(scalability)、吞吐率;
仓库级计算机(Clusters / Warehouse Scale Computers(WSA)):用于软件及服务(SaaS)服务,强调性价比和可用性。
嵌入式计算(Embedded Computers):强调价格。
应用程序中的两种并行
数据级并行(Data-Level Parallelism (DLP)):可以同时操作许多数据项
任务级并行(Task-Level Parallelism (TLP)):创建一些能够单独处理但大量采用并行方式执行的工作任务。
Classes of architectural parallelism / 计算机硬件实现DLP和TLP两种并行的4种方式
指令级并行(Instruction-Level Parallelism (ILP)):流水线
向量体系结构和图形处理器(Vector architectures/Graphic Processor Units (GPUs)):将单条指令并行应用于一个数据集,以开发数据级并行。
线程级并行(Thread-Level Parallelism)
请求级并行(Request-Level Parallelism)
Flynn’s Taxonomy (弗林分类法)
SISD——标准的顺序计算机,可以利用指令级并行
SIMD——开发数据级并行
MISD——没有这种类型的商用多处理器,但是包含这种类型后,分类变得完整
MIMD——开发线程级并行
计算机体系结构
经典:机器语言程序员所看到的传统机器级所具有的属性,即概念性结构与功能特性。
计算机组成:计算机系统结构的逻辑实现
一种体系结构可以有多种组成。e.g. X86
一种组成可以有多种物理实现
现代计算机体系结构则包括组成与实现,即计算机系统的层次结构。
ISA(指令集体系结构)
ARM && MIPS80 x 86ISA分类载入-存储ISA寄存器-存储器ISA存储器寻址必须对齐不需要对齐寻址模式MIPS:寄存器寻址、立即数寻址、位移量寻址
ARM:...+程序计数器寻址、两个寄存器之和...+位移量的3种变化形式(寄存器间接寻址、基址寻址、变址寻址)操作数的类型和大小8、16、32、64、IEEE 754浮点数还支持80位浮点数操作指令简单、易于实现流水化丰富、大控制流指令MIPS条件分支检测寄存器中的内容;
ARM和MIPS将返回地址放在寄存器中和ARM分支测试条件代码位;
将返回地址放在存储器的一个栈中ISA的编码定长 32位变长 1-18字节
趋势
技术趋势(5)集成电路逻辑技术;
半导体DRAM;
半导体闪存;
磁盘技术;
网络技术性能趋势带宽优于时延集成电路中的功率和能耗趋势在时钟频率和电源电压保持不变的情况下,提高能耗效率成本趋势构建成本:技术改进
运行成本:需要高效利用能源来降低
虚拟机:由软件实现的机器
系列机:由同一厂家生产的具有相同的系统结构,但具有不同的组成和实现的一系列不同型号的机器。
WSC和服务器:
相同:非常看重可用性
WSC以很多廉价组件作为构建模块,依靠软件层来捕获和隔离在这一级别进行计算时发生的许多故障。WSC的可扩展性通过连接这些计算机的局域网实现,而服务器则是通过集成计算机硬件来实现。
WSA和超级计算机:
相同:非常昂贵
超级计算机强调浮点性能,常用于运行大型的、通信 密集的批程序,这些程序可能一次运行几个星期。这种紧密耦合性决定了超级计算机要使用非常快速的内部网络;而WSC则更重视互动应用程序、大规模存储、可靠性和很高的因特网带宽。
Principles of Computer Design
① 充分利用并行
② 局部性原理(时间局部性、控件局部性)
③ 以经常性事件为重点
④ Amdahl定律
加快某部件执行