一.ARM寄存器
1.通用寄存器
未分组寄存器:R0~R7
分组寄存器:R8~812
R13:SP,常用作堆栈指针,始终指向堆栈的顶部,当一个数据(32位)推入堆栈时,SP(R13的值减4)向下浮动指向下一个地址,即新的栈顶,当数据从堆栈中弹出时,SP(R13的值加4)向上浮动指向新的栈顶。
R14:连接寄存器(LR),当执行BL子程序调用指令时,R14中得到R15(程序计数器PC)的备份,其他情况下,R14用作通用寄存器。
R15:程序计数器(PC):用于控制程序中指令的执行顺序。正常运行时,PC指向CPU运行的下一条指令。每次取值后PC的值会自动修改以指向下一条指令,从而保证了指令按一定的顺序执行。当程序的执行顺序发生改变(如转移)时,需要修改PC的值。
2.状态寄存器
- CPSR(R16):当前程序状态寄存器,用来保存ALU中的当前操作信息,控制允许和禁止中断、设置处理器的工作模式等。SPSRs:五个备份的程序状态寄存器,用来进行异常处理。当异常发生时,SPSR用于保存CPSR的当前值,从异常退出时可由SPSR来恢复CPSR。
- N、Z、C、V均为条件码标志位,他们的内容可被运算的结果所改变。
N:正负标志,N=1表示运算的结果为负,N=0表示运算的结果为正或0
Z:零标志,Z=1表示运算的结果为0,Z=0表示运算的结果为非0
C:进位标志,加法运算产生了进位时则C=1,否则C=0。借位标志,减肥运算产生了借位则C=0,否则C=1
V:溢出标志,V=1表示有溢出,V=0表示无溢出
3.地址空间
程序正常执行时,每执行一条ARM指令,当前指令计数器增加4个字节
二.汇编语言
1.汇编指令格式
- <opcode>{<cond>}{S}<Rd>,<Rn>{,<OP2>}
格式中<>的内容必不可少,{}中的内容可省略
<opcode>:表示操作码,如ADD表示算术加法
{}:表示指令执行的条件域,如EQ、NE等
{S}:决定指令的执行结果是否影响CPSR的值,使用该后缀则指令执行的结果影响CPSR的值,否则不影响
<Rd>:表示目的寄存器
<Rn>:表示第一个操作数,为寄存器
<op2>:表示第二个操作数,可以是立即数、寄存器或寄存器移位操作数- 例子:ADDEQS R0,R1,#8;其中操作码为ADD,条件域cond为EQ,S表示该指令的执行影响CPSR寄存器的值,目的寄存器Rd为R0,第一个操作数寄存器Rd为R1,第二个操作数OP2为立即数#8
2.指令的可选后缀
- S:指令执行后程序状态寄存器的条件标志位将被刷新
ADDS R1,R0,#2- !:指令中的地址表达式中含有!后缀时,指令执行后,基址寄存器中的地址值将发生变化,变化的结果是:基址寄存器中的值(指令执行后)=指令执行前的值 + 地址偏移量
LDR R3,[R0,#2]! 指令执行后,R0 = R0 + 2
3.指令的条件执行
指令的条件后缀只是影响指令是否执行,不影响指令的内容
条件码 | 助记符后缀 | 标志 | 含义 |
0000 | EQ | Z置位 | 相等 |
0001 | NE | Z清零 | 不相等 |
0010 | CS | C指令 | 无符号数大于或等于 |
0011 | CC | C清零 | 无符号数小于 |
0100 | MI | N置位 | 负数 |
0101 | PL | N清零 | 正数或零 |
0110 | VS | V置位 | 溢出 |
0111 | VC | V清零 | 未溢出 |
1000 | HI | C置位Z清零 | 无符号数大于 |
1001 | LS | C清零Z置位 | 无符号数小于或等于 |
1010 | GE | N等于V | 带符号数大于或等于 |
1011 | LT | N不等于V | 带符号数小于 |
1100 | GT | Z清零且(N等于V) | 带符号数大于 |
1101 | LE | Z置位或(N不等于V) | 带符号数小于或等于 |
1110 | AL | 忽略 | 无条件执行 |
例子:ADDEQ R4,R3,#1 相等则相加,即CPSR中Z置位时该指令执行,否则不执行。
4.ARM指令分类
助记符 | 指令功能描述 | 助记符 | 指令功能描述 |
ADC | 带进位加法指令 | MRC | 从协处理器寄存器到ARM寄存器的数据传输指令 |
ADD | 加法指令 | MRS | 传送CPSR或SPSR的内容到通用寄存器指令 |
AND | 逻辑与指令 | MSR | 传送通用寄存器到CPSR或SPSR的指令 |
B | 分支指令 | MUL | 32位乘法指令 |
BIC | 位清零指令 | MLA | 32位乘加指令 |
BL | 带返回的分支指令 | MVN | 数据取反传送指令 |
BLX | 带返回和状态切换的分支指令 | ORR | 逻辑或指令 |
BX | 带状态切换的分支指令 | RSB | 逆向减法指令 |
CDP | 协处理器数据操作指令 | RSC | 带错位的逆向减法指令 |
CMN | 比较反值指令 | SBC | 带错位减法指令 |
CMP | 比较指令 | STC | 协处理器寄存器写入存储器指令 |
EOR | 异或指令 | STM | 批量内存字写入指令 |
LDC | 存储器到协处理器的数据传输指令 | STR | 寄存器到存储器的数据存储指令 |
LDM | 加载多个寄存器指令 | SUB | 减法指令 |
LDR | 存储器到寄存器的数据加载指令 | SWI | 软件中断指令 |
MCR | 从ARM寄存器到协处理器寄存器的数据传输指令 | TEQ | 相等测试指令 |
MOV | 数据传送指令 | TST | 位测试指令 |
5.ARM寻址方式
- 寻址方式就是根据指令中操作数的信息来寻找操作数实际物理地址的方式
- 立即数寻址
MOV R0,#15 #15就是立即数- 寄存器寻址
ADD R0, R1, R2 将R1和R2的内容相加,其结果存放在寄存器R0中- 寄存器间接寻址
LDR R0, [R4] 以寄存器R4的值作为操作数的地址,在存储器中取得一个操作数存入寄存器R0中- 寄存器移位寻址
ADD R0,R1,R2,LSL #1 将R2的值左移一位,所得值与R1相加,存放到R0中
MOV R0,R1,LSL R3 将R1的值左移R3位,然后将结果存放到R0中- 基址变址寻址
LDR R0,[R1,#4] 将R1的值加4作为操作数的地址,在存储器中取得操作数放入R0中
LDR R0,[R1,#4]! 将R1的值加4作为操作数的地址,在存储器中取得操作数放入R0中,然后R1 = R1+4
LDR R0,[R1],#4 R0 = [R1],R1 = R1 +4
LDR R0,[R1,R2] R0 = [R1+R2]- 多寄存器寻址
一条指令可以完成多个寄存器值的传送(最多可传送16个通用寄存器),连续的寄存器用“-”,否则用“,”
LDMIA R0!,{R1 - R4} R1 = [R0],R2=[R0+4],R3=[R0+8],R4=[R0+12]
后缀IA表示在每次执行玩加载/存储操作后,R0按自长度增加。- 相对寻址
以程序计数器PC的当前值为基地址,指令中的地址标号作为偏移量,将两者相加之后得到操作数的有效地址,如下图的BL分支跳转
BL proc 跳转到子程序proc处执行
…
proc MOV R0,#1
…- 堆栈寻址
按先进先出的方式工作,堆栈指针用R13表示,总是指向栈顶,LDMFD和STMFD分别表示POP出栈和PUSH进栈
STMFD R13!,{R0 - R4};
LDMFD R13!,{R0 - R4};
6.数据处理指令
- MOV指令
MOV {<cond>}{S} Rd,op2 将op2传给Rd
MOV R1, R0 将寄存器R0的值传到寄存器R1
MOV PC,R14 将寄存器R14的值传到PC,常用于子程序返回
MOV R1,R0,LSL #3 将寄存器R0的值左移3位后传给R1
MOV R0,#5 将立即数5传给R0- MVN指令
MVN {<cond>}{S}Rd, op2 将op2取反传给Rd
MVN R0,#0 将0取反后传给R0,R0 = -1
MVN R1,R2 将R2取反,结果保存到R1- 移位指令
LSL 逻辑左移
LSR 逻辑右移
ASR 算术右移
ROR 循环右移
RRX 带扩展的循环右移- ADD加法指令
ADD{<cond>}{S}Rd, Rn, op2
ADD R0,R1,R2 R0 = R1 + R2
ADD R0,R1,#5 R0 = R1 + 5
ADD R0,R1,R2,LSL #2 R0 = R1 + (R2左移2位)- ADC带进位加法指令
ADC{<cond>}{S} Rd,Rn,op2 将Rn的值和操作数op2相加,再加上CPSR中C条件标志位的值,并将结果保存到Rd中
例:用ADC完成64位加法,设第一个64位操作数保存在R2,R3中,第二个64位操作数放在R4,R5中,结果保存在R0,R1中
ADDS R0,R2,R4 低32位相加,产生进位
ADC R1,R3,R5 高32位相加,加上进位- SUB减法指令
SUB{<cond>}{S} Rd,Rn,op2 Rd = Rn - op2
SUB R0,R1,R2 R0 = R1 - R2
SUB R0,R1,#6 R0 = R1 -6
SUB R0,R2,R3,LSL #1 R0 = R2 - (R3左移1位)- SBC带借位减法指令
SBC{}{S} Rd,Rn,op2 把Rn的值减去操作数op2,再减去CPSR中的C标志位的反码,并将结果保存到Rd中,Rd = Rn - op2 - !C
例:用SBC完成64位减法,设第一个64位操作数保存在R2,R3中,第二个64位操作数放在R4,R5中,结果保存在R0,R1中
SUBS R0,R2,R4 低32位相减,S影响CPSR
SBC R1,R3,R5 高32位相减,去除C的反码- RSC带借位的逆向减法指令
RSC{}{S} Rd,Rn,op2 把操作数op2减去Rn,再减去CPSR中的C标志位的反码,并将结果保存到Rd中,Rd = op2 - Rn - !C- 逻辑运算指令
AND{<cond>}{S} Rd,Rn,op2 按位与,Rd = Rn AND op2
ORR{<cond>}{S} Rd,Rn,op2 按位或,Rd = Rn OR op2
OR{<cond>}{S} Rd,Rn,op2 按位异或,Rd = Rn EOR op2- CMP比较指令
CMP{<cond>}{S} Rd,Rn,op2 将Rn的值和op2进行比较,同时更新CPSR中条件标志位的值(实际上是执行一次减法,但不存储结果),当操作数Rn大于op2时,则此后带有GT后缀的指令将可以执行(根据相应的指令判断是否执行,如GT,LT等)。
CMP R1,#10 比较R1和10,并设置CPSR的标志位
ADDGT R0,R0,#5 如果R1>10,则执行ADDGT指令,将R0加5- CMN反值比较指令
CMN{<cond>}{S} Rd,Rn,op2 将Rn的值和op2取反后进行比较,同时更新CPSR中条件标志位的值(实际上将Rn和op2相加),后面的指令就可以根据条件标志位决定是否执行。
CMN R0,R1 将R0和R1相加,并设置CPSR的值- MUL/MLA/SMULL/SMLAL/UMULL/UMLAL乘法指令
MUL 32位乘法指令
MLA 32位乘加指令
SMULL 64位有符号数乘法指令
SMLAL 64位有符号数乘加指令
UMULL 64位无符号数乘法指令
UMLAL 64位无符号数乘加指令
MUL{<cond>}{S} Rd,Rm,Rs Rd = Rm * Rs
MULS R0,R1,R2
MLA{<cond>}{S} Rd,Rm,Rs,Rn Rd = (Rm * Rs) + Rn
MLAS R0,R1,R2,R3
7.数据加载与存储指令
助记符 | 说明 | 操作 |
LDR{}Rd,addr | 加载字数据 | Rd = [addr] |
LDRB{}Rd,addr | 加载无符号字节数据 | Rd = [addr] |
LDRT{}Rd,addr | 以用户模式加载字数据 | Rd = [addr] |
LDRBT{}Rd,addr | 以用户模式加载无符号字节数据 | Rd = [addr] |
LDRH{}Rd,addr | 加载无符号半字数据 | Rd = [addr] |
LDRSB{}Rd,addr | 加载有符号字节数据 | Rd = [addr] |
LDRSH{}Rd,addr | 加载有符号半字数据 | Rd = [addr] |
STR{}Rd,addr | 存储字数据 | [addr] = Rd |
STRB{}Rd,addr | 存储字节数据 | [addr] = Rd |
STRT{}Rd,addr | 以用户模式存储字数据 | [addr] = Rd |
STRBT{}Rd,addr | 以用户模式存储字节数据 | [addr] = Rd |
STRH{}Rd,addr | 存储半字数据 | [addr] = Rd |
LDM{}{type}Rn{!},regs | 多寄存器加载 | reglist = [Rn...] |
STM{}{type}Rn{!},regs | 多寄存器存储 | [Rn...] = reglist |
SWP{}Rd,Rm,[Rn] | 寄存器和存储器字数据交换 | Rd=[Rn],[Rn]=Rm(Rn!=Rd或Rm) |
SWP{}B Rd,Rm,[Rn] | 寄存器和存储器字节数据交换 | Rd = [Rn],[Rn] = Rm(Rn!=Rd或Rm) |
- LDR/STR字数据加载/存储指令
LDR/STR{}{T}Rd,addr LDR指令用于从存储器中将一个32位的字数据加载到目的寄存器Rd中,当程序计数器PC作为目的寄存器时,指令从存储器中读取的字数据被当做目的地址,从而可以实现程序流程的跳转。
STR指令用于从源寄存器中将一个32位的字数据存储到存储器中,和LDR相反。后缀T可选。
LDR R4,START 将存储地址为START的字数据读入R4
STR R5,DATA1 将R5存入存储地址为DATA1中
LDR R0,[R1] 将存储器地址为R1的字数据读入存储器R0
LDR R0,[R1,R2] 将存储器地址为R1+R2的字数据读入存储器R0
LDR R0,[R1,#8] 将存储器地址为R1+8的字数据读入存储器R0
LDR R0,[R1,R2,LSL #2] 将存储器地址为R1+R24的字数据读入存储区R0
STR R0,[R1,R2]! 将R0字数据存入存储器地址R1+R2的存储单元中,并将新地址R2+R2写入R2
STR R0,[R1,#8]! 将R0字数据存入存储器地址R1+8的存储单元中,并将新地址R2+8写入R2
STR R0,[R1,R2,LSL #2] 将R0字数据存入存储器地址R1+R24的存储单元中,并将新地址R2+R24写入R1
LDR R0,[R1],#8 将存储器地址为R1的字数据读入寄存器R0,并将新地址R1+8写入R1
LDR R0,[R1],R2 将存储器地址为R1的字数据读入寄存器R0,并将新地址R1+R2写入R1
LDR R0,[R1],R2,LSL #2 将存储器地址为R1的字数据读入寄存器R0,并将新地址R1+R24写入R1- LDRB/STRB字节数据加载/存储指令
LDRB/STRB{}{T}Rd,addr LDRB指令用于从存储器中将一个8位的字节数据加载到目的寄存器中,同时将寄存器的高24位清零,当程序计数器PC作为目的寄存器时,指令从存储器中读取的字数据被当做目的地址,从而可以实现程序流程的跳转。
STRB指令用于从源寄存器中将一个8位的字节数据存储到存储器中,和LDRB相反。后缀T可选。- LDRH/STRH半字数据加载/存储指令
LDRH/STRH{}{T}Rd,addr LDRH指令用于从存储器中将一个16位的半字数据加载到目的寄存器中,同时将寄存器的高16位清零,当程序计数器PC作为目的寄存器时,指令从存储器中读取的字数据被当做目的地址,从而可以实现程序流程的跳转。
STRH指令用于从源寄存器中将一个16位的半字数据存储到存储器中,和LDRH相反。后缀T可选。- LDM/STM批量数据加载/存储指令
LDM/STM{}{}Rn{!},{^} LDM用于从基址寄存器所指示的一片连续存储器中读取数据到寄存器列表所指向的多个寄存器中,内存单元的起始地址为基址寄存器Rn的值,各个寄存器由寄存器列表regs表示,该指令一般用于多个寄存器数据的出栈操作
STM用于将寄存器列表所指向的多个寄存器中的值存入由基址寄存器所指向的一片连续存储器中,内存单元的起始地址为基址寄存器Rn的值,各个寄存器又寄存器列表regs表示。该指令一般用于多个寄存器数据的进栈操作。
type表示类型,用于数据的存储与读取有以下几种情况:
IA:每次传送后地址值加。
IB:每次传送前地址值加。
DA:每次传送后地址值减。
DB:每次传送前地址值减。
用于堆栈操作时有如下几种情况:
FD:满递减堆栈
ED:空递减堆栈
FA:满递增堆栈
EA:空递增堆栈- SWP字数据交换指令
SWP{},,[] Rd = [Rn],[Rn] = Rm,当寄存器Rm和目的寄存器Rd为同一个寄存器时,指令交换该急促亲和存储器的内容
SWP R0,R1,[R2] R0 = [R2],[R2] = R1
SWP R0,R0,[R1] R0 = [R1],[R1] = R0
SWPB指令用于将寄存器Rn指向的存储器中的字节数据加载到目的寄存器Rd中,目的寄存器的高24位清零,同时将Rm中的字数据存储到Rn指向的存储器中。
8.分支语句
助记符 | 说明 | 说明 |
---|---|---|
B{cond}label | 分支指令 | PC<-label |
BL{cond}label | 带返回的分支指令 | PC<-label,LR=BL后面的第一条指令地址 |
BX{cond}Rm | 带状态切换的分支指令 | PC = Rm & 0xffffffe,T=Rm[0] & 1 |
BLX{cond}label Rm | 带返回和状态切换的分支指令 | PC=label,T=1 PC; PC = Rm &0xffffffe,T=Rm[0] & 1;LR = BLX后面的第一条指令地址 |
- 分支指令B
B{}label 跳转到label处执行,PC=label
例子:
backword SUB R1,R1,#1
CMP R1,#0 比较R1和0
BEQ forward 如果R1=0,跳转到forware处执行
SUB R1,R2,#3
SUB R1,R1,#1
forward ADD R1,R2,#4
ADD R2,R3,#2
B backword 无条件跳转到backword处执行- 带返回的分支指令BL
BL{}label 在跳转之前,将PC的当前内容保存在R14(LR)中保存,因此,可以通过将R14的内容重新加载到PC中,返回到跳转指令之后的指令处执行。该指令用于实现子程序的调用,程序的返回可通过把LR寄存器的值复制到PC寄存器中来实现。
例子:
BL func 跳转到子程序
ADD R1,R2,#2 子程序调用完返回后执行的语句,返回地址
…
func 子程序
…
MOV R15,R14 复制返回地址到PC,实现子程序的返回- 带状态切换的分支指令BX
BX{} Rm 当执行BX指令时,如果条件cond满足,则处理器会判断Rm的位[0]是否为1,如果为1则跳转时自动将CPSR寄存器的标志T置位,并将目标地址的代码解释为Thumb代码来执行,则处理器会切换到Thumb状态,反之,若Rm的位[0]为0,则跳转时自动将CPSR寄存器的标志T复位,并将目标地址处的代码解释为ARM代码来执行,即处理器会切换到ARM状态。
注意:bx lr的作用等同于mov pc,lr。即跳转到lr中存放的地址处。 非零值存储在R0中返回。
那么lr存放的是什么地址呢?lr就是连接寄存器(Link Register, LR),在ARM体系结构中LR的特殊用途有两种:一是用来保存子程序返回地址;二是当异常发生时,LR中保存的值等于异常发生时PC的值减4(或者减2),因此在各种异常模式下可以根据LR的值返回到异常发生前的相应位置继续执行。
当通过BL或BLX指令调用子程序时,硬件自动将子程序返回地址保存在R14寄存器中。在子程序返回时,把LR的值复制到程序计数器PC即可实现子程序返回。
9.堆栈
- 进栈出栈
出栈使用LDM指令,进栈使用STM指令。LDM和STM指令往往结合下面一些参数实现堆栈的操作。
FD:满递减堆栈
ED:空递减堆栈
FA:满递增堆栈
EA:空递增堆栈
满堆栈是指SP(R13)指向堆栈的最后一个已使用地址或满位置(也就是SP指向堆栈的最后一个数据项的位置);相反,空堆栈是指SP指向堆栈的第一个没有使用的地址或空位置。
LDMFD和STMFD分别指POP出栈和PUSH入栈- PUSH指令
PUSH{cond} reglist PUSH将寄存器推入满递减堆栈
PUSH {r0,r4-r7} 将R0,R4-R7寄存器内容压入堆栈
2.9.3. POP指令
POP{cond} reglist POP从满递减堆栈中弹出数据到寄存器
POP {r0,r4-r7} 将R0,R4-R7寄存器从堆栈中弹出