1.线程级并行(Thread Level Parallelism)
并发(Concurrency)指的是在同一时间段内进行多个任务(但是一个时间点上只有一个任务在进行)。单处理器系统下,多线程实现的是并发而非并行。
并行(Parallelism)指的是在同一时间点时进行多个任务。多线程的并发需要在多处理器系统下才能实现,而多处理器实现一般依赖于以下两个技术:
- 超线程技术(Hyper-Threading,简称HT)
超线程技术实现了单个物理核心同时两个线程,也就是别人常说的虚拟内核数。比如单物理核心实现的双线程,它同时可以处理两个线程,它的物理核心数其实是是1个,通过Hyperthreading技术实现的线程级并行(
Thread Lever Parallelism
)。
- 多核技术(Mult-Core Processor)
处理器中包含多个内核,每一个内核均可以独立处理线程,也可以同时利用HT技术,一个核心处理多个线程。
2.指令级并行(Instruction Level Parallelism)
指令级并行,依赖于指令级流水技术,通过指令级的流水达到在同一时间点(指令周期,更准确的说)内,无数据依赖的指令同时执行。常见的依赖关系包括真依赖(Read After Write, RAW)和两个存储相关依赖,即反依赖(Write After Read, WAR)和写后写(Write After Write)。后两种依赖可以通过使用额外的存储来避免,前一种往往需要通过其他手段,如添加空周期、指令调度(在中间添加其他无依赖的指令增加两条指令中间间隔的周期)和数据旁路技术(在Write指令执行阶段就将结果送给Read指令)。
RISC(Reduced Instruction Set Computers)架构相较于CISC(Complex Instruction Set Computers)架构,由于具有更小而简单的指令执行阶段,更加便于实现流水技术。但是,对CISC而言,复杂的指令是通过微程序实现的,而微程序又由小而简单的微指令构成,因此也可以受益于流水技术。
3.数据级并行(Data Level Parallelism)
主要运用了SIMD
(Single -Instruction ,Multple -Data)单指令多数据流
技术。通过一个指令,对多个相同类型的数据(也叫"数据向量”)进行同一的操作。SIMD指令集可以提供更快的图像,声音,视频数据等运行速度,常见的SIMD指令集有MMX,SSE4和AVX。