为什么要进行指令重排呢?

本篇内容摘抄自:《实战Java高并发程序设计2》

为什么要进行指令重排呢?

在学习Java中的多线程是,肯定绕不开Java的内存模型(JMM),以及原子性、可见性、有序性。

并且JMM的关键技术点都是围绕着多线程的原子性、可见性和有序性来建立的。

在学习有序性时,都会提到指令重排,因为有指令重排,所以在并发程序的运行中,程序的执行可能就会出现乱序。给人的直观感觉就是:写在前面的代码,会在后面执行。

注意这里说的是可能存在。因为如果指令没有重排,这个问题就不存在了,但是指令是否发生重排、如何重排,恐怕是我们无法预测的。因此,对于这类问题,我认为比较严谨的描述是:线程A的指令执行顺序在线程星B看来是没有保证的。如果运气好的话,线程B也许真的可以看到和线程A一样的执行顺序。

不过这里还需要强调一点,对于一个线程来说,它看到的指令执行顺序一定是一致的(否则应用根本无法正常工作)。也就是说指令重排是有一个基本前提的,就是保证串行语义的一致性。

指令重排不会使串行的语义逻辑发生问题。因此在串行代码中,大可不必担心。

也就是:指令重排可以保证串行语义一致,但是没有义务保证多线程间的语义也一致。

那为什么要进行指令重排呢?答案是出于性能考虑。提高CPU处理性能。

我们知道,一条指令的执行是可以分为很多步的。简单地说,可以分为以下几步:

  • 取指IF。
  • 译码和取寄存器操作数ID。
  • 执行或者有效地址计算EX。
  • 存储器访问MEM。
  • 写回WB。

我们的汇编指令也不是一步就可以执行完毕的,在CPU中实际工作时,它还是需要分为多个步骤依次执行的。当然,每个步骤所涉及的硬件也可能不同。比如,取指时会用到PC寄存器和存储器,译码时会用到指令寄存器组,执行时会使用ALU,写回时需要寄存器组。

ALU指算术逻辑单元。它是CPU的执行单元,是CPU的核心组成部分,主要功能是进行二进制算术运算。

由于每一个步骤都可能使用不同的硬件完成,因此,聪明的工程师们就发明了流水线技术来执行指令。下图显示了指令流水线的工作原理。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-m7pRzZSX-1683633591702)(/Users/wangluwei/Library/Application Support/typora-user-images/image-20230509194119641.png)]

可以看到,当第2条指令执行时,第1条指令其实并未执行完,确切地说第一条指令还没开始执行,只是刚刚完成了取值操作而已。这样的好处非常明显,假如这里每一个步骤都需要花费1毫秒,那么指令2等待指令1完全执行后,再执行,则需要等待5毫秒,而使用流水线后,指令2只需要等待1毫秒就可以执行了。如此大的性能提升,当然让人眼红。更何况,实际的商业CPU的流水线级别甚至可以达到10级以上,性能提升更加明显。

有了流水线,CPU才能真正高效地执行,但是,别忘了一点,流水线总是害怕被中断的。流水线满载时,性能确实相当不错,但是一旦中断所有的硬件设备都会进入一个停顿期,再次满载又需要几个周,因此,性能损失会比较大。所以,我们必须要想办法尽量不让流水线中断!

那么答案就来了,之所以需要做指令重排,就是为了尽量少地中断流水线。

当然了,指令重排只是减少中断的一种技术,实际上,在CPU的设计,我们还会使用更多的软硬件技术来防止中断。有兴趣的可以查阅相关资料。

来看个例子:

下图展示了A=B+C这个操作的执行过程。写在左边的指令就是汇编指令。LW表示load,其中LW R1,B 表示把B的值加载到R1寄存器中。ADD指令就是加,把R1、R2的值相加,并存放到R3中。SW表示store,存储,就是将R3寄存器的值保存到变量A中。

右边就是流水线的情况。注意,在ADD指令上,有一个大叉,表示一个中断。也就是说ADD在这里停顿了一下。为什么ADD会在这里停顿呢?原因很简单,R2中的数据还没有准备好,所以,ADD操作必须进行一次等待。由于ADD的延迟,导致其后所有的指令都要慢一拍。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-q6HENeFB-1683633591703)(/Users/wangluwei/Library/Application Support/typora-user-images/image-20230509194455838.png)]

理解上面这个例子。来看下面这个更复杂的情况。

a = b + c
d = e - f

上述代码指令重排之前的执行过程:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9Ic3286o-1683633591703)(/Users/wangluwei/Library/Application Support/typora-user-images/image-20230509195023265.png)]

由于ADD和SUB都需要等待上一条指令的结果,因此,在这里插入了不少停顿。那么对于这段代码,是否有可能消除这些停顿呢? 显然是可以的,我们只需要将LW Re,e和LW Rf,f移动到前面执行即可。思想很简单,先加载e和f对程序是没有影响的。既然在ADD的时候一定要停顿一下,那么停顿的时间还不如去做点有意义的事情。

重排之后的执行过程:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iZtJ5M6T-1683633591703)(/Users/wangluwei/Library/Application Support/typora-user-images/image-20230509195144439.png)]

重排后,所有的停顿都已经消除,流水线已经可以十分顺畅地执行了。最终结果:
在这里插入图片描述

由此可见,指令重排对于提高CPU处理性能是十分必要的。虽然确实带来了乱序的问题,但是这点牺牲是完全值得的。

哪些指令不能重排:Happen-Before规则

虽然Java虚拟机和执行系统会对指令进行一定的重排,但是指令重排是有原则的,并非所有的指令都可以随便改变执行位置,以下罗列了一些基本原则,这些原则是指令重排不可违背的。

  • 程序顺序原则:一个线程内保证语义的串行性。
  • volatile规则:volatile变量的写先于读发生,这保证了volatile变量的可见性。
  • 锁规则:解锁(unlock)必然发生在随后的加锁(lock)前。
  • 传递性:A先于B,B先于C,那么A必然先于C。
  • 线程的start()方法先于它的每一个动作。
  • 线程的所有操作先于线程的终结(Thread.join())。
  • 线程的中断(interrupt())先于被中断线程的代码。
  • 对象的构造函数的执行、结束先于finalize()方法。

这些原则都是为了保证指令重排不会破坏原有的语义结构。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

悬浮海

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值