Table of Contents
顺序性:
乱序执行·逻辑正确性
现代体系结构的每一个核的指令流水是乱序执行的,但是他能够保证其执行效果正确,即等同于顺序执行。
不过这带来的问题是对于一个核在主观上它的执行状态最终保证正确,但是对于别的核,如果在某一个中间时间点需要观察它呢?看到的是一个不正确的中间状态对应的数据:
乱序中间态:
core1:
asm write a=x(没提交)
asm write b=y(已提交)
core2:
asm if(b==y)
assert(a==x) // 出错了,因为core1乱序提交!
一般情况下,我们可以容忍这类问题发生。
但是当 write b=y 是一个非常重要的多核控制原语的时候,这类问题就无法容忍了。
局部顺序性与局部正确中间态:
杜绝这种问题的关键是让 write b=y操作满足局部顺序性,从而在该操作上得到局部正确中间态:即该操作一旦执行成功,则前面的操作都执行成功。该操作如果没有执行,那么后面的操作也都没有执行。 也即任何时刻只要b==y,那么a==x。
一致性:
各核及线程缓存·volatile
各核缓存及线程缓存不一致是影响并发并行计算正确性的一大问题。
如果上层编程逻辑需要使他们可见的值保持一致,则可以引入volatile。
原子性:
1 多核体系结构与多核原子操作
一. 何谓"原子操作":
原子操作就是: 不可中断的一个或者一系列操作, 也就是不会被线程调度机制打断的操作, 运行期间不会有任何的上下文切换(context switch).
多核原子操作:不可打断(原子),不可干扰(互斥=》串行=》最高隔离)。在原子操作基础上,不被其他核上运行的指令干扰的指令操作。如何不被其他核指令干扰?内存是多核共用的,所以当本核访问内存的时候,其他核都不能访问。下文会讲到总线锁。
二. 为什么关注原子操作?
1. 如果确定某个操作是原子的, 就不用为了去保护这个操作而加上会耗费昂贵性能开销的锁. - (巧妙的利用原子操作和实现无锁编程)
2. 借助原子操作可以实现互斥锁(mutex). (linux中的mutex_lock_t)
3. 借助互斥锁, 可以实现让更多的操作变成原子操作.
三. 单核CPU的原子操作:
在单核CPU中, 能够在一个指令中完成的操作都可以看作为原子操作, 因为中断只发生在指令间.
四. 多核CPU的原子操作:
在多核CPU的时代(确实moore定律有些过时了,我们需要更多的CPU,而不是更快的CPU,无法处理快速CPU中的热量散发问题), 体系中运行着多个独立的CPU, 即使是可以在单个指令中完成的操作也可能会被干扰. 典型的例子就是decl指令(递减指令), 它细分为三个过程: "读->改->写", 涉及两次内存操作. 如果多个CPU运行的多个进程在同时对同一块内存执行这个指令, 那情况是无法预测的.
五. 硬件支持 & 多核原子操作:
软件级别的原子操作是依赖于硬件支持的. 在x86体系中, CPU提供了HLOCK pin引线, 允许CPU在执行某一个指令(仅仅是一个指令)时拉低HLOCK pin引线的电位, 直到这个指令执行完毕才放开. 从而锁住了总线, 如此在同一总线的CPU就暂时无法通过总线访问内存了, 这样就保证了多核处理器的原子性(个人理解:另外使得cpu强制串行性,该条指令不能和任何其他指令之间发生乱序提交). (想想这机制对性能影响挺大的).
关于为什么本文所讲的“多核原子操作”要锁总线
内存屏障的结果,是在操作原子性基础上实现核间高度隔离以及局部顺序性。
1. 核间高度隔离:锁对其他核上的内存操作(不管R/W)互斥,从而为本操作提供最高级别隔离性。
2. 局部顺序性:如上文,加总线锁之后还会使得本核的指令流水在此串行化,防止本指令相对之前和之后的其他指令发生乱序提交,提供局部状态顺序性。
http://blog.codingnow.com/2007/12/fence_in_multi_core.html
六. 哪些操作可以确定为原子操作了?
对于非long和double基本数据类型的"简单操作"都可以看作是原子的. 例如: 赋值和返回. 大多数体系中long和double都占据8个字节, 操作系统或者JVM很可能会将写入和读取操作分离为两个单独的32位的操作来执行, 这就产生了在一个读取和写入过程中一个上下文切换(context switch), 从而导致了不同任务线程看到不正确结果的的可能性.
递增, 递减不是原子操作: i++反汇编的汇编指令: (需要三条指令操作, 和两个内存访问, 一次寄存器修改)
1
2
3
|