(1)满堆栈操作先调整SP,然后存入数据。
(2)空堆栈操作先存入数据,然后调整SP。
(3)递增堆栈调整SP时,执行SP=SP+4
(4)递减堆栈调整SP时,执行SP=SP-4
(1)空堆栈操作先调整SP,然后存入数据。
(2)满堆栈操作先存入数据,然后调整SP。
(3)递减堆栈调整SP时,执行SP=SP+4
(4)递增堆栈调整SP时,执行SP=SP-4
ldmfd sp!, {r4-r11, lr} /*出栈*/
mov pc, r4
这就变成绝对转移了,但是,b指令不允许以寄存器的内容作为目标地址。
事实上,子程序调用的返回指令mov pc,lr也是绝对转移。
ARM处理器中有一条执行指令的流水线,不管是相对转移还是绝对转移,当CPU执行到引起转移时,即引起pc突变的指令时,其后面的几条指令已经被取入了流水线,甚至已经对指令解码了。程序计数器pc的突变迫使流水线舍弃这些已经在流水线中的指令,使流水线短暂断流,然后从新的地址取指令,并又逐步“灌满”流水线。在这个过程中,CPU可能会有一个短暂(例如几个时钟周期)的“无所事事”的空隙。在典型的RISC结构中,一般都把转移前的最后一条指令改放到转移指令后面,或者把转移目标处的第一条指令搬过来放到转移指令后面,称为指令调度。这样,把本来会浪费掉的几个时钟周期利用起来,效率当然提高了,但是对于代码的阅读、理解以及调试,都有不利的影响。所以常常受到来自CISC阵营的批评和攻击。ARM体系结构的设计者并没有紧跟RISC的潮流,仍然采用传统的方法,宁可浪费一点效率也要保证程序的简洁,所以不采用指令调度,而只是丢弃已经进入流水线的指令。毕竟,大多数情况下,因此而降低的效率只占很小的比例。
相对转移指令b有个变形bl,意为“转移并连接(Branch and Link)”,专门用于子程序调用。执行这条指令时CPU将pc的当前值(指向下一条指令)保存在寄存器lr中,即R14中,同时转向目标地址。这是,要从子程序返回时,只要把lr的内容写入pc就行了。例如:
bl uHALir_ReadMode
…
uHALir_ReadMode:
mov pc, lr
这里考虑为什么不像传统的做法那样自动把返回地址保存在堆栈中?原因前面提到过了,RISC的设计原则之一就是尽量少访问内存,而改用寄存器代替,这样可以有效的提高效率。堆栈是在内存中,把返回的地址放到堆栈意味着访问内存,而寄存器间的访问比访问内存操作要快得多。这样,先通过较快的方法进入到子程序,如果还需要进一步调用更深层的子程序,则可以到那时再把lr的内容保存(“溅出”)堆栈中,如果不需要访问深层子程序,则可以省去为返回地址而读/写内存的操作。程序在运行时会形成一颗“子程序调用树”。统计表明,对叶节点,即底层子程序的调用常常占很高的比例,这是因为对底层子程序的调用往往是在循环中进行的,而且,底层子程序本身往往是很小的,为调用本身很小的底层子程序访问内存两次,所占的比例就不小了。