Volatile最终解释

最新推荐文章于 2024-08-29 10:16:51 发布

Vision-wang

最新推荐文章于 2024-08-29 10:16:51 发布

阅读量1.3k

点赞数 2

文章标签： java 缓存开发语言

本文链接：https://blog.csdn.net/weixin_56892092/article/details/125359239

版权

1.JMM模型

JMM模型提出了java的多线程工作模型，它不去为每种CPU（Intel，AMD），多核心或者单核心，以及多缓存无缓存还是几级缓存，做具体的描述，而是给出了一种Java层面的工作模型，以线程，线程独立空间为描述，给出一种让不懂底层的开发者可以理解的并发问题模型  有了这种模型，进而引出原子性，可见性，有序性这些并发概念，但是想要真正解决问题是要JVM针对不同的硬件做出处理才能达到效果，对于我们上层应用只需要使用synchronize和volatile就可以了。

2.MESI协议

对于Intel的X86CPU来说，MESI缓存行协议，它和上层应用没有任何关系，只要使用这种类型的CPU，开启MESI它就是存在的，对于2核CPU来说，两个L2或者L1缓存，只要数据被写入到缓存中，那么另一个缓存就立即被可见 MESI除了提供缓存中内容可见性，还提供了锁缓存行的支持  这里提出一个问题，既然缓存行中的数据没有问题，我们的Java程序为什么还会出现可见性问题？   也就是一个线程操作了数据，数据被写入到缓存中另一个线程有时可见，有时很久不可见呢？

有了MESI协议，尽管多核CPU逻辑上是这样的，但是L1，L2也相当于共享内存，只要在L1，L2中有相同数据就是立即可见的

3.StoreBuffer

1.可见性问题

1. 在CPU的架构设计中我们忽略了一个东西就是StoreBuffer，它是确确实实存在的，但是因为Intel不开源，我们可以通过测试发现如果数据放入到各自CPU核心运行线程的StoreBuffer中，数据是不被可见的

2.除了StoreBuffer没有被放入到缓存中不可见，写入L1,L2,L3高速缓存的时候，intel有个规定，MESI的硬性规定就是如果写一份数据，那个L1.L2.L3中必须有这个数据，如果没有要先从内存读取出来，但是如果两个核心cpu就有两个Store buffer，如果其中一个将新值放入到Store buffer中了，而L3缓存中没有，去内存中读老值放到L3中，此时cpu2直接将L3的老值拿走了，那么这个新值不可见
    这种情况叫StoreLoad问题，这种情况其实是两个线程的读写乱系问题，最终会以内存可见性问题体现

这也就说明只有MESI还不能保证立即可见，因为上面还有一层，这一层无法控制，所以以上两种情况都是不可见的原因

上述问题如何解决？
要解决这个还需要根据Intel的设计架构，Intel设计有很多代，但是不管哪一代都有StoreBuffer存在，但是有一些有缓存行L1，L2，L3等，有一些没有，那么就要通过不同的方案解决
1. 有缓存行，有MESI协议，通过指令的Lock前缀，能使用MESI的锁缓存行的支持让缓存行立即锁住，然后将StoreBuffer的数据立即刷入
2. 无缓存行，直接到共享内存，通过指令的Lock前缀，采用总线锁的方式

这也是为什么在早期CPU无多级缓存，慢的原因，总线锁属于硬件层面，MESI通过软件层面进行优化了

2.内存写入乱序问题

对于一个有缓存MESI协议的这种情况，MESI的硬性规定就是如果写一份数据，那个L1.L2.L3中必须有这个数据，如果a2在缓存中有数据，而a3没有，那么有一些CPU就会让a2先写，a3慢慢的让缓存去内存读，这就是内存写入乱序问题

幸好Intel的X86没有做这种优化，因此没有内存写入乱序问题，LoadStore，LoadLoad，StoreStore问题在这种处理器都是不存在的，因此只有上述的StoreLoad问题

4.Volatile

1.C语言的Volatile

保证编译器不优化，从而每次读取完整执行过程，不在寄存器中缓存数据与之同功能的还有 1.直接关闭c语言编译器优化，显然一般不会使用，代码一般需要优化 2.使用编译器屏障 _asm_volatile_(“；；；“ “memory“) 3.使用volatile 粒度关闭＞volatile＞编译器屏障上述的这些操作即保证数据可见性，也保证了指令有序性

2.Java中的Volatile

StoreStoreBarrier
volatile 写操作
StoreLoadBarrier

LoadLoadBarrier
volatile 读操作
LoadStoreBarrier

在JVM中，使用volatile会解析为上面的一些列指令，它们交给解释器来执行，但是解析器有不同的种类

1.使用C++解释器

#define READ_MEM_BARRIER __asm __volatile ("":::"memory")
#define WRITE_MEM_BARRIER __asm __volatile ("":::"memory")

inline void OrderAccess::loadload()   { acquire(); }
inline void OrderAccess::storestore() { release(); }
inline void OrderAccess::loadstore()  { acquire(); }
inline void OrderAccess::storeload()  { fence(); }

inline void OrderAccess::acquire() {
  READ_MEM_BARRIER;
}
inline void OrderAccess::release() {
  WRITE_MEM_BARRIER;
}
inline void OrderAccess::fence() {
  FULL_MEM_BARRIER;
}
就使用了C语言中的编译器中的编译器屏障

2.使用模板解释器

inline void OrderAccess::loadload()   { acquire(); }
inline void OrderAccess::storestore() { release(); }
inline void OrderAccess::loadstore()  { acquire(); }
inline void OrderAccess::storeload()  { fence(); }

inline void OrderAccess::acquire() {
  volatile intptr_t local_dummy;
#ifdef AMD64
  __asm__ volatile ("movq 0(%%rsp), %0" : "=r" (local_dummy) : : "memory");
#else
  __asm__ volatile ("movl 0(%%esp),%0" : "=r" (local_dummy) : : "memory");
#endif // AMD64
}

inline void OrderAccess::release() {
  // Avoid hitting the same cache-line from
  // different threads.
  volatile jint local_dummy = 0;
}

inline void OrderAccess::fence() {
  if (os::is_MP()) {
    // always use locked addl since mfence is sometimes expensive
    // 因为mfence很昂贵
#ifdef AMD64    //看lock前缀
    __asm__ volatile ("lock; addl $0,0(%%rsp)" : : : "cc", "memory");
#else
    __asm__ volatile ("lock; addl $0,0(%%esp)" : : : "cc", "memory");
#endif
  }
}

只有StoreLoad写操作才会将数据更改，所以只有它使用了Lock前缀强制将新值刷出去

就是使用了lock前缀，直接锁缓存行将StoreBuffer刷出去，就足够保证可见性了，同时lock前缀还有编译器屏障的作用
并没有使用mfence，这个会清空流水线，开销非常大

3.总结

Java中的volatile与软件硬件都相关，软件层面使用了 编译器屏障，禁止直接从寄存器获取数据，保证了可见性，每次都从内存取而不是取寄存器中的，硬件层面使用 Lock前缀+MESI缓存一致性特性快速写出StoreBuffer数据，也保证了可见性

有序性是通过 编译器屏障，禁止编译器优化指令顺序，指令执行乱序在CPU中也帮我们规避掉了，Lock前缀+MESI也解决了多线程读写有序性问题

在单例模式DCL必须加volatile中，主要使用的是 单线程中编译器屏障，禁止编译器优化指令顺序，使其单例对象按顺序完成初始化的整个流程

在很多博文中，可见性和有序性是分开来谈的，但是通过软件和硬件层面我们可以发现，可见性和有序性是共同出现的，并且使用一个技术可以将两个问题共同解决，编译器屏障既解决了可见性也解决了有序性，Lock刷新同样也是

Vision-wang

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫