1. adr和ldr指令
adr是小范围的地址读取伪指令,ldr是大范围的读取地址伪指令。实际上adr是将基于PC相对偏移的地址值或基于寄存器相对地址值读取的为指令,而ldr用于加载32位立即数或一个地址到指定的寄存器中。如果在程序中想加载某个函数或者某个在联接时候指定的地址时请使用adr,例如在lds中需要重新定位的地址。当加载32为的立即数或外部地址时请用ldr。
举例,有如下代码:
ldr r0,_start
adr r0,_start
ldr r0,=_start
_start:
nop
编译,生成目标文件,反汇编:
arm-linux-as adr.s -o adr.o
arm-linux-ld adr.o -o adr
arm-linux-objdump -d adr
结果如下所示:
注意:由于arm采用流水线基址,当正确读取了PC的值时,该值为当前指令地址值加上8个字节,也就是PC指向当前指令的下两条指令的地址;
1.ldr r0, _start :读取指定地址中的值
ldr在此是一条指令,把内存地址 _start 位置中的值读入r0。(_start为指针之意,读取指针的值)在这里_start是一个标号(是一个相对程序的表达式),汇编程序计算相对于 PC 的偏移量,并生成相对于 PC的前索引指令:ldr r0, [pc, #4]。执行指令后,r0 = 0xeafffffe。可以在和_start标号的相对位置不变的情况下移动( 也就是说整段代码从flash中拷贝到ram中依然可以正常运行)。
2.adr r0, _start :将指定地址赋到r0中
ADR是小范围的地址读取伪指令.ADR 指令将基于PC 相对偏移的地址值读取到寄存器中.在汇编编译源程序时,ADR 伪指令被编译器替换成一条合适的指令.通常,编译器用一条
ADD 指令或SUB 指令来实现该ADR 伪指令的功能,若不能用一条指令实现,则产生错误,编译失败.
r0的值为((标号_start 的地址与此指令的距离差)+(此指令的地址))。在此例中被汇编成:add r0, pc, #0。该代码可以在和标号相对位置不变的情况下移动(也就是说整段代码从flash中拷贝到ram中依然可以正常运行); 假如这段代码在 0x30000000 运行,那么 adr r0, _start 得到 r0 = 0x3000000c;如果在地址 0 运行,就是 0x0000000c 了。通过这一点可以判断程序在什么地方运行。U-boot中那段relocate代码就是通过adr实现判断当前程序是在RAM中还是flash中。
3.ldr r0, =_start :将指定标号的值赋给r0
ldr在此是一条伪指令,_start(即:label-expr)是一个相对程序的或外部的表达式。汇编程序将相对程序的标号表达式 label-expr 的值放在一个文字池中,并生成一个相对程序的 LDR 指令来从文字池中装载该值,在此例中生成的指令为:ldr r0, [pc, #0],对应文字池中的地址以及值为:0x00000010: 3000000c。如果 label-expr 是一个外部表达式,或者未包含于当前段内,则汇编程序在目标文件中放置一个链接程序重定位命令。链接程序在链接时生成地址。
因此取得的是标号 _start 的绝对地址,这个绝对地址(运行地址)是在连接的时候确定的。它要占用 2 个 32bit 的空间,一条是指令,另一条是文字池中存放_start 的绝对地址。因此可以看出,不管这段代码将来在什么地方运行,它的结果都是 r0 = 0x3000000c。由于ldr r0, =_start取得的是_start的绝对地址,这句代码可以在_start标号的绝对位置不变的情况下移动;如果使用寄存器pc在程序中可以实现绝对转移。(1.绝对地址;2.标号对应的值)
2.ldr指令说明
ldr的确是个复杂的指令,现总结一下:
首先要判断我们用的是ldr arm指令还是伪指令。 当我们用的是arm指令时,它的作用是将某个地址里的内容加载到寄存器。而伪指令ldr的作用就是向寄存器里加载立即数。
(1) ldr伪指令
ldr伪指令的格式是 ldr Rn, =expr
其中,expr是要加载到Rn中的内容,一般可以是立即数或者label。
如果expr可以用8bit数据向右移偶数位得到,那么这条伪指令就被编译器翻译成mov指令。具体的移位情况可以去查阅资料。反之如果立即数很大,超过了12bit的表示范畴,那么就不能用一条mov指令了,毕竟arm指令最大只有32bit的空间可用(RISC的arm所有的指令长度是一致的,效率较高,当然我们并不关心16bit的thumb指令)。如果不能用一条32bit的指令乘下来,那么就只能另辟蹊径了,新开一段缓冲,将立即数expr放到里面,然后将其地址(暂时标记为addr)拿来使用:
ldr Rn, addr
xxx (xxx就是expr)
xxx
由于编译器一般来说新安排的存储这个立即数expr的缓冲的位置是在相应代码的附近(这个应该可以控制,好像是使用.ltorg伪指令)。我们从addr地址加载数据到Rn不就可以了。
(2)ldr arm 指令
就是将一个地址的内容加载到寄存器。不能用mov,因为arm里的mov只是在寄存器之间传输数据,不支持在寄出器和memory之间传递数据。因此就出现了ldr/str指令。如ldr Rn, addr,注意这里的addr的值也是有限制的。这个label应该距离当前指令的距离不超过4k。因为我们知道label在具体使用的时候应该是被翻译成了相对偏移,如果这个label长度不超过12bit,那么就不应超过4k,我们可以这样做:
ldr pc, _start_armboot
_start_armboot: .word arm_startboot
这样label _start_armboot就在指令下方,因此肯定是合法的。
3.多寄存器寻址指令ldmia/ldmib
多寄存器和堆栈寻址的用法:多寄存器寻址:LDMIA,LDMIB,STMIA,STMIB,LDMDA,LDMDB,STMDA,STMDB;
堆栈寻址:LDMFA,LDMFD,STMFA,STMFD,LDMEA,LDMED,STMEA,STMED;
弄清堆栈寻址的SP的变化:LDMFA,LDMFD,STMFA,STMFD,LDMEA,LDMED,STMEA,STMED;
IA: 每次传送后地址加4; IB: 每次传送前地址加4; DA: 每次传送后地址减4;
DB: 每次传送前地址减4; FD: 满递减堆栈; ED: 空递减堆栈;
FA: 满递增堆栈; EA: 空递增堆栈。
1、多寄存器寻址:
LDMIA R0!,{R1-R4}
;R1<----[R0]
;R2<----[R0+4]
;R3<----[R0+8]
;R4<----[R0+12]
例如:
所有的示例指令执行前:
mem32[0x1000C] = 0x04
mem32[0x10008] = 0x03
mem32[0x10004] = 0x02
mem32[0x10000] = 0x01
r0 = 0x00010010
r1 = 0x00000000
r3 = 0x00000000
r4 = 0x00000000
1) ldmia r0!, {r1-r3} 2) ldmib r0!, {r1-r3}
执行后: 执行后:
r0 = 0x0010001C r0 = 0x0010001C
r1 = 0x01 r1 = 0x02
r2 = 0x02 r2 = 0x03
r3 = 0x03 r3 = 0x04
2、堆栈寻址:
STMFD入栈指令,相当于STMDB
STMFD SP!,{R2-R4} ;[SP-4]<---R4
;[SP-8]<---R3
;[SP-12]<---R2
LDMFD出栈指令,相当于LDMIA
LDMFD SP!,{R6-R8} ;R6<----[SP]
;R7<----[SP+4]
;R8<----[SP+8]
4. Thumb 存储器访问指令
5.
Thumb 数据处理指令