基于《计算机体系结构:量化研究方法》第5章
线程级并行(TLP)需要多处理器,以及软件或操作系统提供的并行。
并行处理的挑战
- 程序本身并行有限,无法充分利用多处理器
- 多处理器通信成本较高
架构
按照多处理器访问存储器的方式分成两种架构
SMP (Symmetric multiprocessing,对称多处理器),也叫UMA(一致存储器访问),所有处理器访问存储器的延时是一样的。
DSM(Distributed shared memory,分布式共享存储器),也叫NUMA(非一致存储器访问),处理器访问远程存储器需要经过拥有该存储器的处理器,访问本地存储器和远程存储器的延迟不一样。
SMP和DSM中,多处理器之间的通信是通过共享地址空间完成的。