加载和存储指令
ARM微处理器支持加载/存储指令用于在寄存器和存储器之间传送数据,加载指令用于将存储器中的数据传送到寄存器,存储指令则完成相反的操作。
LDR{条件} 目的寄存器, <存储器地址>
指令用于将存储器中的一个32位的字数据传送到目的寄存器中。本指令通常用于将存储器上的字数据传送到通用寄存器。
LDR R0,[R1]
将存储器地址为R1的字数据读入寄存器R0
LDR R0,[R1,R2]
将存储器地址为R1+R2的字数据读入寄存器R0。
LDR R0,[R1,#8]
将存储器地址为R1+8的字数据读入寄存器R0
LDR R0, [R1,R2]!
将存储器地址R1+R2的字数据读入寄存器R0,同时将新地址R1+R2写入R1。
LDR R0, [R1,#5]!
将存储器地址R1+5的字数据读入寄存器R0,同时将新地址R1+5写入到R1。
LDR R0,[R1], R2
将存储器地址为R1的字数据读入寄存器R0,并将新地址R1+R2写入R1。
LDR R0,[R1,R2,LSL #2]!
将存储器地址为R1+R2*4的字数据读入到寄存器R0中,并将新地址R1+R2*4写入R1
LDR R0, [R1], R2, LSL #2
将存储器地址为R1的字数据读入寄存器R0,并进新地址R1+R2*4写入R1。
LDR{条件}B 目的寄存器,<存储器地址>
LDRB指令用于从存储器中将一个8位的字节数据传送到目的寄存器中,同时将寄存器的高24位清零。
LDRB R0,[R1]
LDRB R0,[R1,#8]
LDR{条件}H 目的寄存器,<存储器地址>
LDRH指令用于从存储器中将一个16位的半字数据传送到目的寄存器中,同时将寄存器的高16位清零。
LDRH R0,[R1]
LDRH R0,[R1,R2]
STR{条件} 源寄存器,<存储器地址>
STR指令用于从源寄存器中将一个32位字数据传送到存储器中。
STR R0,[R1], #8
STR R0,[R1,#8]
ARM微处理器所支持的批量数据加载/存储指令可以一次在一片连续的存储器单元和多个寄存器之间传递数据,批量加载指令用于将一片连续的存储单元的数据传送到多个寄存器,批量数据存储指令则完成相反的操作。
LDM
STM
LDM{条件}{类型}
指令用于从由基址寄存器所指示的一片连续存储器到寄存器列表所指示的多个寄存器之间传送数据,该指令的常见用途是将多个寄存器的内容入栈或出栈。其中,{类型}为以下几种情况:
IA 每次传送后地址加1;
IB 每次传送前地址加1;
DA 每次传送后地址减1;
DB 每次传送前地址减1;
FD 满递减堆栈;
ED 空递减堆栈;
FA 满递增堆栈;
EA 空递增堆栈;
{!}为可选后缀,若选用该后缀,则当数据传送完毕之后,将最后的地址写入基址寄存器,否则基址寄存器的内容部改变。基址寄存器不允许为R15,寄存器列表可以为R0-R15的任意组合。
{^}为可选后缀,当指令为LDM且寄存器列表中包含R15,选用该后缀时表示:除了正常的数据传送之外,还将SPSR复制到CPSR。
STMFD R13!, {R0,R4-R12,LR}
将寄存器列表中的寄存器(R0,R4到R12,LR)存入堆栈。
LDMFD R13!, {R0,R4-R12,LR}
将堆栈内容恢复到寄存器(R0,R4到R12,LR)。
数据交换指令
ARM微处理器所支持数据交换指令能在存储器和寄存器之间交换数据。
SWP 字数据交换指令
SWPB 字节数据交换指令
SWP{条件} 目的寄存器, 源寄存器1,[源寄存器2]
SWP指令用于将源寄存器2所指向的存储器中的字数据传送到目的寄存器中,同时将源寄存器1中的字数据传送到源寄存器2所指向的存储器中,显然,当源寄存器1和目的寄存器为同一个寄存器时,指令交换该寄存器和存储器的内容。
SWP R0,R1,[R2]
SWP R0,R0,[R1]
移位指令
ARM微处理器支持数据的移位操作,移位操作在ARM指令集中不作为单独的指令使用,它只能作为指令格式中是一个字段。
LSL logical shifter left
ASL arithmetic shifter left
LSR logical shifter right
ASR arithmetic shifter right
ROR rotate right
通用寄存器,LSL操作数
LSL可完成对寄存器中的内容进行逻辑左移操作,按操作数所指定的数量向左移位,低位用零来填充。其中,操作数可以是通用寄存器,也可以是立即数(0—31)。
MOV R0,R1,LSL#2
将R1中的内容左移两位后传送到R0中。
通用寄存器,ROR 操作数
ROR可完成对通用寄存器中的内容进行循环右移的操作,按操作数所指定的数量向右循环移位,左端用右端移出的位来填充。其中,操作数可以是通用寄存器,也可以是立即数(0-31)。显然,当进行32位的循环右移操作时,通用寄存器中的值不改变。
MOV R0,R1,ROR#2
将R1中的内容循环右移两位后传送到R0中。
异常产生的指令
ARM微处理器所支持的异常指令如下两条:
SWI 软件中断指令
BKPT 断点中断指令
SWI{条件} 24位的立即数
SWI指令用于产生软件中断,以便用户程序能调用操作系统的系统API。操作系统在SWI的异常处理程序中提供了相应的系统服务,指令中24位的立即数指定用户程序调用的API类型。
SWI 0x02
该指令调用操作系统编号为02的系统例程。
伪指令
这些助记符与指令系统的助记符不同,没有相对应的操作码,通常称这些特殊指令助记符为伪指令,他们所完成的操作称为伪操作。伪指令在源程序中的作用是为完成汇编程序作各种准备工作,这些伪指令仅在汇编过程中起作用,一旦汇编结束,伪指令的使命就完成。
ARM中有如下几种伪指令:符号定义伪指令、数据定义伪指令、汇编控制伪指令、宏指令以及其他伪指令。
符号定义伪指令用于定义ARM汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。常见的符号定义伪指令有如下几种:
定义全局变量的GBLA、GBLL和GBLS
定义局部变量的LCLA、LCLL和LCLS
对变量赋值的SETA、SETL、SETS
为通用寄存器列表定义名称的RLIST
GBLA:定义一个全局的数字变量,并初始化为0;
GBLL:定义一个全局的逻辑变量,并初始化为F(假);
GBLS:定义一个全局的字符串变量,并初始化为空;
以上三条伪指令用于定义全局变量,因此在整个程序范围内变量名必须唯一。
GBLA Test1
定义一个全局的数字变量,变量名为Test1
Test1 SETA 0xaa
进该变量赋值为0xaa
GBLL Test2
定义一个全局的逻辑变量,变量名为Test2
Test2 SETL {TRUE}
将该变量赋值为真
GBLS Test3
定义一个全局的字符串变量,变量名为Test3
Test3 SETS “testing”
将该变量赋值为“testing”
名称 RLIST {寄存器列表}
RLIST 伪指令用于对一个通用寄存器列表定义名称,使用该伪指令定义的列表名称可在ARM指令LDM/STM中使用。在LDM/STM指令中,列表中的寄存器访问次序为根据寄存器的编号由低到高,而与列表中的寄存器排序无关。
Reglist RLIST {R0-R5,R8,R10}
数据定义伪指令一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。
DCB DCW DCD DCFD DCFS DCQ SPACE MAP FIELD
标号 DCB 表达式
DCB伪指令用于分配一片连续的字节存储单元并用伪指令中指定的表达式初始化。其中,表达式可以为0-255的数字或字符串。DCB也可用“=”代替。
Str DCB “This is a test!”
标号 SPACE 表达式
SPACE伪指令用于分配一片连续的存储区域并初始化为0.其中,表达式为要分配的字节数。SPACE也可用“%”代替。
DateSpace SPACE 100
MAP 表达式 {基址寄存器}
MAP伪指令用于定义一个结构化的内存表的首地址。MAP也可用“^”代替。表达式可以为程序中的标号或数学表达式,基址寄存器为可选项,当基址寄存器选项不存在时,表达式的值即为内存表的首地址,当该选项存在时,内存表的首地址为表达式的值与基址寄存器的和。MAP伪指令通常与FIELD伪指令配合使用来定义结构化的内存表。
MAP 0x100,R0
定义结构化内存表首地址的值为0x100+R0。
标号 FIELD 表达式
FIELD伪指令用于定义一个结构化内存表中的数据域。FILED也可用“#”代替。表达式的值为当前数据域在内存表中所占的字节数。FIELD伪指令常与MAP伪指令配合使用来定义结构化的内存表。MAP伪指令定义内存表的首地址,FIELD伪指令定义内存表中的各个数据域,并可以为每个数据域指定一个标号供其他的指令引用。
MAP 0x100
A
B
S
汇编控制伪指令:
IF ELSE ENDIF
WHILE WEND
MACRO MEND
MEXIT
WHILE 逻辑表达式
指令序列
WEND
其他伪指令:
AREA 段名 属性1,属性2,......
AREA伪指令用于定义一个代码段或数据段。其中,段名若以数字开头,则该段名需用“|”括起来,如|1_test|。属性字段表示该代码段的相关属性,多个属性用逗号分隔。常用属性如下:
CODE:用于定义代码段,默认为READONLY。
DATA:用于定义数据段,默认为READWRITE。
READONLY:定义本段为只读,代码段默认为READONLY。
READWRITE;指定本段为可读可写,数据段的默认属性READWRITE。
ALIGN属性,使用方式为:
ALIGN 表达式
在默认时,ELF的代码段和数据段是按字对齐的。
一个汇编语言程序至少要包含一个段,当程序太长时,也可以将程序分为多个代码段和数据段。
AREA Init,CODE,READONLY
该伪指令定义了一个代码段,段名为Init,属性为只读。
ALIGN {表达式{偏移量}}
ALIGN伪指令可通过添加填充字节的方式,使当前位置满足一定的对齐方式。其中,表达式的值用于指定对齐方式,可能的取值为2的幂,如1,2,4,8,16等。若未指定表达式,则将当前位置对齐到下一个字的位置。偏移量也为一个数字表达式,若使用该字段,则当前位置的对齐方式为:2的表达式次幂+偏移量。
AREA Init,CODE,READONLY,ALIGN=3
指定后面的指令为8字节对齐。
CODE16(或CODE32)
CODE16伪指令通知编译器,其后的指令序列为16位的Thumb指令。CODE32伪指令通知编译器,其后的指令序列为32位的ARM指令。因此,在使用ARM指令和Thumb指令混合编程的代码里,可用这两条伪指令进行切换,但注意他们只通知编译器其后指令的类型,并不能对处理器进行状态的切换。
ENTRY
ENTRY伪指令用于指定汇编程序的入口点,在一个完整的汇编程序中至少要有一个ENTRY(也可有多个,当有多个ENTRY时,程序的真正入口点由链接器指定),但在一个源文件里最多只能有一个ENTRY。
名称 EQU 表达式{类型}
EQU伪指令用于为程序中的常量、标号等定义一个等效的字符名称,类似于C语言中的#define。其中EQU可用“*”代替。
Test EQU 50
Addr EQU 0x55,CODE32
EXPORT 标号
EXPORT伪指令用于在程序中声明一个全局的标号,该标号可在其他的文件中引用。EXPORT可用GLOBAL代替。标号在程序中区分大小写。
AREA Init,CODE,READONLY
EXPORT Stest
声明一个可全局引用的标号Stest
IMPORT 标号
IMPORT伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用。标号在程序中区分大小写。
AREA Init,CODE,READONLY
IMPORT Main
通知编译器当前文件要引用标号Main,但Main在其他源文件中定义
END
END伪指令用于通知编译器已经到了源程序的结尾。