【并发】3、MESI

最新推荐文章于 2023-05-15 07:30:00 发布

zxfhahaha

最新推荐文章于 2023-05-15 07:30:00 发布

阅读量153

点赞数 1

分类专栏：并发文章标签： mesi lock锁前缀

本文链接：https://blog.csdn.net/zxfhahaha/article/details/113122413

版权

并发专栏收录该内容

14 篇文章 1 订阅

订阅专栏

MESI

java代码执行流程
硬件缓存锁定机制
MESI
MESI优化和他们引入的问题

java代码执行流程

一个java类通过javac编译成字节码文件后会通过类加载子系统装载进元空间
在堆中生成Class实例
创建线程
要执行的方法的字节码会加到虚拟机栈栈帧中，执行
执行引擎（解释器/JIT）会将字节码翻译成汇编指令（硬件原语）

硬件再将汇编指令翻译成二进制，速度非常快
这个二进制代码对应的线程被CPU调度后就会被执行
因为jvm是klt的，操作系统中会会维护一个线程常量池，其中的每个线程与jvm上的线程一一对应

硬件缓存锁定机制

加了volatile
汇编指令LOCK会触发硬件缓存锁定机制（总线锁，缓存一致性协议），使得在锁定操作期间不会响应总线控制请求。
硬件缓存锁定机制有两种：

总线锁
早期用总线锁保证缓存一致，因为cpu是通过总线访问内存的，一个核的线程对总线加锁后只有他能访问内存，其他线程就不能了。也就是说只要使用了总线锁，我们的cpu就是单核的。
缓存一致性协议
缓存一致性是一个协议，目前实现的使用最多的就是mesi去保证缓存一致性。
当一个缓存行装不下一个数据的时候，这时mesi就会升级成总线锁。

MESI

多核CPU的情况下有多个一级缓存，如何保证缓存内部数据的一致,不让系统数据混乱。这里就引出了一个一致性的协议MESI。

MESI协议缓存状态

MESI 是指4中状态的首字母。每个缓存行（Cache line）有4个状态，可用2个bit表示，它们分别是：

状态	描述	监听任务
M 修改 (Modified)	该Cache line有效，数据被修改了，和内存中的数据不一致，数据只存在于本Cache中。	缓存行必须时刻监听所有试图读该缓存行相对就主缓存行写回主存并将状态变成S（共享
E 独享、互斥 (Exclusive)	该Cache line有效，数据和内存中的数据一致，数据只存在于本Cache中。	缓存行也必须监听其它缓存读主存中该缓存行的操变成S（共享）状态。
S 共享 (Shared)	该Cache line有效，数据和内存中的数据一致，数据存在于很多Cache中。	缓存行也必须监听其它缓存使该缓存行无效或者独成无效（Invalid）。
I 无效 (Invalid)	该Cache line无效。	无

注意：

对于M和E状态而言总是精确的，他们在和该缓存行的真正状态是一致的，而S状态可能是非一致的。如果一个缓存将处于S状态的缓存行作废了，而另一个缓存实际上可能已经独享了该缓存行，但是该缓存却不会将该缓存行升迁为E状态，这是因为其它缓存不会广播他们作废掉该缓存行的通知，同样由于缓存并没有保存该缓存行的copy的数量，因此（即使有这种通知）也没有办法确定自己是否已经独享了该缓存行。
从上面的意义看来E状态是一种投机性的优化：如果一个CPU想修改一个处于S状态的缓存行，总线事务需要将所有该缓存行的copy变成invalid状态，而修改E状态的缓存不需要使用总线事务。

MESI状态转换

状态转换图
在这里插入图片描述

触发事件
- 本地读取（Local read）
  本地cache读取本地cache数据
- 本地写入（Local write）
  本地cache写入本地cache数据
- 远端读取（Remote read）
  其他cache读取本地cache数据（应该是从主存读数据）
- 远端写入（Remote write）
  其他cache写入本地cache数据（应该是内存的数据被修改了）
cache分类
前提：所有的cache共同缓存了主内存中的某一条数据
注意：本地的事件触发本地cache和触发cache为相同。
- 本地cache:指当前cpu的cache。
- 触发cache:触发读写事件的cache。
- 其他cache:指既除了以上两种之外的cache。

在这里插入图片描述

cpu会监听总线中被lock前缀修饰的变量，为其分配四种状态的一种，如果是第一次读就会给他分配E状态，后来又有别的线程读了这个变量，那就会更改每个的状态为S

如果两个线程都要对这个变量修改，那就各自对自己的缓存行去加锁，如果加锁成功则就可以修改，状态由S->M。加锁的同时还要向外部发一个本地写缓存行的信号，这样其他拥有这个变量的线程就知道已经被别人写了，这时候状态由S->I 并被丢弃。
如果两个线程都在自己内部加锁成功，都往外发本地写缓存行的信号了，那总线就会裁决

在这里插入图片描述

多核缓存协同操作

假设有三个CPU A、B、C，对应三个缓存分别是cache a、b、 c。在主内存中定义了x的引用值为0。
在这里插入图片描述

单核读取

那么执行流程是：
CPU A发出了一条指令，从主内存中读取x。
从主内存通过bus读取到缓存中（远端读取Remote read）,这时该Cache line修改为E状态（独享）.
在这里插入图片描述

双核读取

那么执行流程是：

CPU A发出了一条指令，从主内存中读取x。
CPU A从主内存通过bus读取到 cache a中并将该cache line 设置为E状态。
CPU B发出了一条指令，从主内存中读取x。
CPU B试图从主内存中读取x时，CPU A检测到了地址冲突。这时CPU A对相关数据做出响应。此时x 存储于cache a和cache b中，x在chche a和cache b中都被设置为S状态(共享)。

修改数据

那么执行流程是：

CPU A 计算完成后发指令需要修改x.
CPU A 将x设置为M状态（修改）并通知缓存了x的CPU B, CPU B将本地cache b中的x设置为I状态(无效)
CPU A 对x进行赋值。

同步数据

那么执行流程是：

CPU B 发出了要读取x的指令。
CPU B 通知CPU A,CPU A将修改后的数据同步到主内存时cache a 修改为E（独享）
CPU A同步CPU B的x,将cache a和同步后cache b中的x设置为S状态（共享）。

缓存行伪共享

什么是伪共享？

CPU缓存系统中是以缓存行（cache line）为单位存储的。目前主流的CPU Cache 的Cache Line 大小都是64Bytes。在多线程情况下，如果需要修改“共享同一个缓存行的变量”，就会无意中影响彼此的性能，这就是伪共享（False Sharing。

例如：
举个例子: 现在有2个long 型变量 a 、b，如果有t1在访问a，t2在访问b，而a与b刚好在同一个
cache line中，此时t1先修改a，将导致b被刷新！

怎么解决伪共享？

Java8中新增了一个注解：@sun.misc.Contended。加上这个注解的类会自动补齐缓存行，需要注意的是此注解默认是无效的，需要在jvm启动时设置-XX:-RestrictContended才会生效。

@sun.misc.Contended
public final static class TulingVolatileLong {
	public volatile long value = 0L;
	//public long p1, p2, p3, p4, p5, p6;
}

MESI优化和他们引入的问题

缓存的一致性消息传递是要时间的，这就使其切换时会产生延迟。当一个缓存被切换状态时其他缓存收到消息完成各自的切换并且发出回应消息这么一长串的时间中CPU都会等待所有缓存响应完成。可能出现的阻塞都会导致各种各样的性能问题和稳定性问题。

CPU切换状态阻塞解决存储缓存（Store Bufferes）

Store Bufferes

比如你需要修改本地缓存中的一条信息，那么你必须将I（无效）状态通知到其他拥有该缓存数据的CPU缓存中，并且等待确认。等待确认的过程会阻塞处理器，这会降低处理器的性能。因为这个等待远远比一个指令的执行时间长的多。

store buffers

为了避免这种CPU运算能力的浪费，Store Bufferes被引入使用。处理器把它想要写入到主存的值写到缓存即store buffers，然后继续去处理其他事情。当所有失效确认（Invalidate Acknowledge）都接收到时，数据才会最终被提交。

写到store buffer的原因

写到store buffer的原因因为写操作后发本地写缓存行到其他cpu需要时间，为了不影响我接下来的操作，就先写到store buffer，继续执行后续的，等到另外一个核收到消息并把该变量失效后（失效即放到queue中排队，等cpu有空就会去这个失效队列中把这些变量拿掉），并发消息给刚刚发通知的cpu核，这时这个核再从store buffer中把刚刚改的同步到缓存行并写到主内存，但是同步回主内存的时机不确定。

Store Bufferes的风险

Store Bufferes的风险:

第一、就是处理器会尝试从存储缓存（Store buffer）中读取值，但它还没有进行提交。这个的解决方案称为Store Forwarding，它使得加载的时候，如果存储缓存中存在，则进行返回。
第二、保存什么时候会完成，这个并没有任何保证。

硬件内存模型

失效队列

执行失效也不是一个简单的操作，它需要处理器去处理。另外，存储缓存（Store Buffers）并不是无穷大的，所以处理器有时需要等待失效确认的返回。这两个操作都会使得性能大幅降低。为了应付这种情况，引入了失效队列。它们的约定如下：

对于所有的收到的Invalidate请求，Invalidate Acknowlege消息必须立刻发送
Invalidate并不真正执行，而是被放在一个特殊的队列中，在方便的时候才会去执行。
处理器不会发送任何消息给所处理的缓存条目，直到它处理Invalidate。

内存屏障

即便是这样处理器已然不知道什么时候优化是允许的，而什么时候并不允许。
干脆处理器将这个任务丢给了写代码的人。这就是内存屏障（Memory Barriers）。

写屏障 Store Memory Barrier(a.k.a. ST, SMB, smp_wmb)
是一条告诉处理器在执行这之后的指令之前，应用所有已经在存储缓存（store buffer）中的保存的指令。
即在更新数据之前必须将所有存储缓存（store buffer）中的指令执行完毕。
读屏障Load Memory Barrier (a.k.a. LD, RMB, smp_rmb)
是一条告诉处理器在执行任何的加载前，先应用所有已经在失效队列中的失效操作的指令。
即在读取之前将所有失效队列中关于该数据的指令执行完毕。

zxfhahaha

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【并发】3、MESI

MESIjava代码volatile底层如何保证可见性MESIstore bufferjava代码一个java类通过javac编译成字节码文件后会通过类加载子系统装载进元空间在堆中生成Class实例创建线程要执行的方法的字节码会加到虚拟机栈栈帧中，执行执行引擎（解释器/JIT）会将字节码翻译成汇编指令（硬件原语）硬件再将汇编指令翻译成二进制，速度非常快这个二进制代码对应的线程被CPU调度后就会被执行因为jvm是klt的，操作系统中会会维护一个线程常量池，其中的每个线程与jvm上的线
复制链接

扫一扫