volatile关键字详解

①针对无效化指令的加速：在缓存的基础上，新增Store Buffer硬件存储结构，即核心先将变量写入Store Buffer，然后再处理其他事情，如果后面的操作需要用到这个变量，就可以从Store Buffer中读取变量的值，核心读数据的順序变成Store Buffer → 缓存Cache → 内存，从而这样在任何时候核心都不用卡住，做不了关于这个变量的操作了：

②针对确认响应的加速：在缓存的基础上，新增Invalidate Queue硬件结构，其他核心收到某个核心的Invalidate的命令后，立即给该核心回Acknowledge，并把Invalidate这个操作，先记录到Invalidate Queue里，当其他操作结束时，再从Invalidate Queue中取命令，进行Invalidate操作，因此，当某个核心收到确认响应时，其他核心对应的缓存行可能还没完全置为Invalid状态；

5、MESI解决方案的缺点

①既然Store Buffer充当了CPU与缓存Cache之间的桥梁，那么，在缓存Cache收到其他核CPU的Invalidate命令确认之间，CPU还是继续使用Store Buffer里面的旧数据；

②根据Invalidate Queue定义，如果核1收到变量a=1的指令并放入Invalidate Queue中，但核1的CPU继续按照a=2的命令去执行，当核1的CPU执行完之后再去执行Invalidate Queue命令，此刻为时已晚；

既然这2个针对性解决方案还有缺点，那该怎么解决呢？

6、MESI最终解决方案：内存屏障

内存屏障，简单来讲就是一行命令，规定了某个针对缓存的操作，常用的内存屏障指令有2个：写屏障和读屏障；

①针对Store Buffer：某核CPU在后续变量的新值写入之前，把Store Buffer的所有值刷新到缓存Cache，然后该核CPU要么就等待刷新完成后写入，要么就把后续变量的新值放到Store Buffer中，直到Store Buffer的数据按顺序刷入缓存，这种也称为内存屏障中的写屏障（Store Barrier）。

举个例子：某核CPU的缓存Cache收到40个变量的最新值，此时，该CPU先把Store Buffer中40个变量全部刷新到缓存Cache中，在刷新的过程中，CPU就2种情况：

要么等Store Buffer把这40个变量刷新完之后，再从缓存Cache把最新数据写入到Store Buffer；

要么Store Buffer一边在把40个变量刷新到缓存Cache的同时，缓存Cache也一边把最新数据写入Store Buffer，直到Store Buffer把这40个变量都刷新到缓存Cache中为止；

相当于，CPU必须等待缓存Cache与Store Buffer数据完全交换完成之后(这里的交换策略有2个)，CPU再从Store Buffer中获取最新数据，从而避免Store Buffer与缓存Cache数据的不一致性；

②针对Invalidate Queue：执行后需等待Invalidate Queue完全应用到缓存后，后续的读操作才能继续执行，保证执行前后的读操作对其他CPU而言是顺序执行的，这种也称为内存屏障中的读屏障（Load Barrier）。

举个例子：假如Invalidate Queue中有40个变量要设置为Invalid，CPU必须等待Invalidate Queue对应的指令执行完毕，缓存Cache对应的40个变量都置为Invalid状态，此刻，CPU如果需要这40个变量时，需要从电脑内存中读取最新的数据，这样我就能保证，该核CPU必须按照Invalidate Queue中收到指令的顺序去分别执行；

这里的写读，指的是Store Buffer，其写入缓存Cache，其从缓存Cache读取；