从指令级并行到线程级并行
在处理机设计中引入硬件线程的概念,并行的概念就从指令级扩展至线程级并行
多线程处理机的具体实现方法又可以分为:
细粒度多线程(交错多线程)处理机
粗粒度多线程(阻塞多线程)处理机
同时多线程结构
同时多线程(SMT)结合了超标量技术和细粒度多线程技术的优点。
超线程处理机结构
为了支持两个硬件线程同时运行,让每级流水线中的资源通过三种方式之一复用于两个线程:复制,分区或共享
多处理机
多处理机系统的分类
多处理机系统由多个独立的处理机组成,每个处理机能够独立执行自己的程序
并行向量处理机(PVP)
对程多处理机(SMP)
大规模并行处理机(MPP)
分布共享存储器多处理机(DSM)
SMP的基本概念
SMP定义具有如下特征的独立计算机系统:
有两个以上功能相似的处理机
这些处理机共享同一主存和I/O设施,以总线或其他内部连接机制互连在一起;这样,存储器存储时间对每个处理机都是大志相同的。
所有处理机共享对I/O设备的访问,或通过一通道,或通过提供到同一设备路径的不同通道
所有处理机能完成同样的功能
系统被一个集中式操作系统(os)控制
SMP的结构
为便利来自I/O处理器的DMA传送,应提供如下特征
寻址
仲裁
分时共享
一般来说,工作站和个人机SMP都有两级cache;现在某些处理机还使用了L3 cache
多核处理机
多核处理机的优势
高并行性:可同时执行的线程数或任务数是单处理机的倍数
高通信效率:各个处理机核只需要在核内部的相对较小的区域内交换数据。
高资源利用率:多核结构可有效支持片内资源共享
低功耗:不在依靠提高主频改善性能
地设计复杂度:每个核的结构相对简单
较低的成本:各个核共享器件芯片封装核芯片I/O资源
多核处理机的组织结构
同构多核处理机:所有计算内核结构相同,地位对等
异构多核处理机:各个计算机内核结构不同,地位不对等
一般多采用主处理核+协处理核的主从架构
多核处理机的对称性
对称多核处理机片内包含相同结构的核,多个核紧密耦合,并运行一个统一的操作系统
非对称多核若是同构多核,但每个核运行一个独立的操作系统或同一操作系统独立实例,就变成非对称多核
多核处理机的关键技术
多核处理机架构:每个核自身的结构,每个核是否应该采用超标量技术或超线程技术,多核之间俺的对等性,核的数目
多核系统存储结构设计:目前仍然采用存储器分级的方式解决存储速度问题
多核处理机的cache一致性
多核处理机的核间通信与同步技术
低功耗设计
多核软件设计