关于缓存一致性协议、MESI、StoreBuffer、InvalidateQueue、内存屏障、Lock指令和JMM的那点事
一、多核CPU、单核CPU、多CPU、单CPU、并行&并发、进程&线程、总线
-
进程:系统资源分配的最小单元,如启动一个程序就会有一个进程申请一片内存
-
线程:任务调度的最小单元,一个进程下有多个线程,如启动一个Tomcat进程后调起n个线程处理一个任务
-
并发:看起来是多个线程同时运行,但底层还是竞争CPU时间片,因为一个CPU核心在同一时刻只能有一个线程运行
-
并行:在多个核心的情况下,同个时刻每个核心中都有线程在运行,关键是系统中多个核心
- 总线
CPU总线是所有CPU与芯片组连接的主干道,负责CPU与外界所有部件的通信,包括高速缓存、内存、北桥,其控制总线向各个部件发送控制信号、通过地址总线发送地址信号指定其要访问的部件、通过数据总线双向传输。
二、Lock前缀指令、Lock#信号
LOCK是计算机汇编语言的一个指令前缀,LOCK会使紧跟在其后面的指令变成原子指令(atomic instruction)。
LOCK指令前缀只能加在以下这些指令前面:
ADD,ADC,AND,BTC,BTR,BTS,CMPXCHG,CMPXCH8B,CMPXCHG16B,DEC,INC,NEG,NOT,OR,SBB,SUB,XOR,XADD,XCHG
传送门:Intel LOCK前缀指令介绍
三、总线锁
汇编语言有Lock前缀,会锁总线,其它CPU对内存的读写请求都会被阻塞,直到锁释放。
总线锁就是将cpu和内存之间的通信锁住,使得在锁定期间,其他cpu处理器不能操作其他内存中数据,故总线锁开销比较大。
总线锁的实现是采用cpu提供的LOCK# 信号,当一个cpu在总线上输出此信号时,其他cpu的请求将被阻塞,那么该cpu则独占共享内存。
四、缓存锁
从P6系列处理器开始,如果访问的内存区域已经缓存在处理器的高速缓存行中(L1、L2、L3高速缓存),LOCK#信号不会被发送。它会对CPU缓存中的缓存行进行锁定。在修改之后通过缓存一致性协议来保证修改的原子性。
什么情况下不会使用缓存锁?
第一种情况是:当操作的数据不能被缓存在处理器内部,或操作的数据跨多个缓存行(cache line)时,则处理器会调用总线锁定。
第二种情况是:有些处理器不支持缓存锁定。对于Intel 486和Pentium处理器,就算锁定的内存区域在处理器的缓存行中也会调用总线锁定。
五、缓存一致性协议(MESI)
什么是缓存行?
缓存行(cache line)是缓存读取的最小单元,缓存行是 2 的整数幂个连续字节,一般为 32-256 个字节,最常见的缓存行大小是 64 个字节。
MESI是以缓存行的几个状态来命名的(全名是Modified、Exclusive、 Share or Invalid)。该协议要求在每个缓存行上维护两个状态位,使得每个数据单位可能处于M、E、S和I这四种状态之一,各种状态含义如下:
(1)M
:被修改的。处于这一状态的数据,只在本CPU中有缓存数据,而其他CPU中没有。同时其状态相对于内存中的值来 说,是已经被修改的,且没有更新到内存中。
(2)E
:独占的。处于这一状态的数据,只有在本CPU中有缓存,且其数据没有修改,即与内存中一致。
(3)S
:共享的。处于这一状态的数据在多个CPU中都有缓存,且与内存一致。
(4)I
:无效的。本CPU中的这份缓存已经无效。
总结四种状态:可分为两种 独占(M和E)共享(S和I)。
独占:M是只有本cpu有,而且缓存已被修改,与内存不一致;E是只有本cpu有,缓存未修改和内存一致。
共享:S是多cpu缓存中都有,该缓存未修改与内存一致;I是多cpu缓存中都有,该缓存修改与内存不一致,该缓存失效。
一个处于M状态的缓存行,必须时刻监听所有试图读取该缓存行对应的主存地址的操作,如果监听到,则必须在此操作执行前把其缓存行中的数据写回CPU。
一个处于S状态的缓存行,必须时刻监听使该缓存行无效或者独享该缓存行的请求,如果监听到,则必须把其缓存行状态设置为I。
一个处于E状态的缓存行,必须时刻监听其他试图读取该缓存行对应的主存地址的操作,如果监听到,则必须把其缓存行状态设置为S。
当CPU需要读取数据
时,如果其缓存行的状态是I的,则需要从内存中读取,并把自己状态变成S,如果不是I,则可以直接读取缓存中的值,但在此之前,必须要等待其他CPU的监听结果,如其他CPU也有该数据的缓存且状态是M,则需要等待其把缓存更新到内存之后,再读取。
当CPU需要写数据
时,只有在其缓存行是M或者E的时候才能执行(有独占权),否则需要发出特殊的RFO指令(Read Or Ownership,这是一种总线事务),通知其他CPU置缓存无效(I),这种情况下性能开销是相对较大的。在写入完成后,修改其缓存状态为M。
传送门:cpu实现原子性-总线锁和缓存锁
实现缓存一致性的方式有哪些?
- 基于目录
- 总线嗅探
六、总线嗅探
什么是总线(BUS)?
总线(Bus)是计算机各种功能部件之间bai传送信息的公共通信干线,它是由导线组成的传输线束。总线是一种内部结构,它是cpu、内存、输入、输出设备传递信息的公用通道,主机的各个部件通过总线相连接,外部设备通过相应的接口电路再与总线相连接,从而形成了计算机硬件系统。
要想实现写传播,最常见的方法就是总线嗅探——所有CPUcore时刻监听总线上的一切活动,一旦有某个core执行了写操作,此时其就会通过总线将该事件广播给所有core,每个core接收到后对自己的高速缓存中的变量做响应的操作。
七、写缓冲区 Store Buffer
八、失效队列 Invalidate Queue
九、Happens Before 八大规则
传送门:Happens Before