目录
GNU汇编语法
GNU 汇编语法适用于所有的架构,并不是 ARM 独享的, GNU 汇编由一系列的语句组成,每行一条语句,每条语句有三个可选部分,如下:
label: instruction @ comment
label
即标号,表示地址位置
,有些指令前面可能会有标号,这样就可以通过这个标号得到指令的地址
,标号也可以用来表示数据地址
。注意 label 后面的“:”,任何以“:”结尾的标识符都会被识别为一个标号
。instruction
即指令,也就是汇编指令或伪指令
。@
符号,表示后面的是注释
,就跟 C 语言里面的“/”和“/”一样,其实在 GNU 汇编文件中我们也可以使用“/”和“/”来注释。comment
就是注释内容
。
例如:
add:
MOVS R0, #0X12 @设置 R0=0X12
上面代码中“add:”就是标号,“MOVS R0,#0X12”就是指令,最后的“@设置 R0=0X12”就是注释。
注意! ARM 中的指令、伪指令、伪操作、寄存器名等可以全部使用大写
,也可以全部使用小写
,但是不能大小写混用 。
用户可以使用.section 伪操作来定义一个段,汇编系统预定义了一些段名:
- .text 表示代码段。
- .data 初始化的数据段。
- .bss 未初始化的数据段。
- .rodata 只读数据段。
我们可以自己使用.section
来定义一个段,每个段以段名开始,以下一段名或者文件结尾结束
,比如:
.section .testsection @定义一个 testsetcion 段
汇编程序的默认入口标号是_start
,不过我们也可以在链接脚本中使用 ENTRY 来指明其它的入口点,下面的代码就是使用_start 作为入口标号:
.global _start
_start:
ldr r0, =0x12 @r0=0x12
上面代码中.global 是伪操作,表示_start 是一个全局标号,类似 C 语言里面的全局变量一样,常见的伪操作有:
GNU 汇编同样也支持函数,函数格式如下:
函数名:
函数体
返回语句
Cortex-A7常用汇编指令
处理器内部数据传输指令
使用处理器做的最多事情就是在处理器内部来回的传递数据,常见的操作有:
- 将数据从一个寄存器传递到另外一个寄存器。
- 将数据从一个寄存器传递到特殊寄存器,如 CPSR 和 SPSR 寄存器。
- 将立即数传递到寄存器。
MOV指令
MOV 指令用于将数据从一个寄存器拷贝到另外一个寄存器
,或者将一个立即数传递到寄存器
里面,使用示例如下:
MOV R0, R1 @将寄存器 R1 中的数据传递给 R0,即 R0=R1
MOV R0, #0X12 @将立即数 0X12 传递给 R0 寄存器,即 R0=0X12
MRS指令
MRS 指令用于将特殊寄存器
(如 CPSR 和 SPSR)中的数据传递给通用寄存器
,要读取特殊寄存器的数据只能使用 MRS 指令
!使用示例如下:
MRS R0, CPSR @将特殊寄存器 CPSR 里面的数据传递给 R0,即 R0=CPSR
MSR指令
MSR 指令和 MRS 刚好相反, MSR 指令用来将普通寄存器的数据传递给特殊寄存器
,也就是写特殊寄存器,写特殊寄存器只能使用 MSR,使用示例如下:
MSR CPSR, R0 @将 R0 中的数据复制到 CPSR 中,即 CPSR=R0
存储器访问指令
ARM 不能直接访问存储器,比如 RAM 中的数据, I.MX6UL 中的寄存器就是 RAM 类型的,我们用汇编来配置 I.MX6UL 寄存器的时候需要借助存储器访问指令,一般先将要配置的值写入到 Rx(x=0~12)寄存器中
,然后借助存储器访问指令将 Rx 中的数据写入到 I.MX6UL 寄存器
中。读取 I.MX6UL 寄存器也是一样的,只是过程相反。常用的存储器访问指令有两种: LDR 和STR,用法如表 7.2.1.2 所示:
LDR指令
LDR 主要用于从存储加载数据到寄存器 Rx
中, LDR 也可以将一个立即数加载到寄存器 Rx
中, LDR 加载立即数的时候要使用“=”
,而不是“#”。在嵌入式开发中, LDR 最常用的就是读取 CPU 的寄存器值
,比如 I.MX6UL 有个寄存器 GPIO1_GDIR,其地址为 0X0209C004,我们现在要读取这个寄存器中的数据,示例代码如下:
LDR R0, =0X0209C004
@将寄存器地址 0X0209C004 加载到 R0 中,即 R0=0X0209C004
LDR R1, [R0]
@读取地址 0X0209C004 中的数据到 R1 寄存器中
上述代码就是读取寄存器 GPIO1_GDIR 中的值,读取到的寄存器值保存在 R1 寄存器中,上面代码中 offset 是 0,也就是没有用到 offset。
STR指令
LDR 是从存储器读取数据, STR 就是将数据写入到存储器中,同样以 I.MX6UL 寄存器GPIO1_GDIR 为例,现在我们要配置寄存器GPIO1_GDIR 的值为 0X20000002,示例代码如下:
LDR R0, =0X0209C004
@将寄存器地址 0X0209C004 加载到 R0 中,即 R0=0X0209C004
LDR R1, =0X20000002
@R1 保存要写入到寄存器的值,即 R1=0X20000002
STR R1, [R0]
@将 R1 中的值写入到 R0 中所保存的地址中
LDR 和 STR 都是按照字
进行读取和写入的,也就是操作的 32 位
数据,如果要按照字节、半字
进行操作的话可以在指令“LDR”后面加上 B 或 H
,比如按字节操作的指令就是 LDRB 和STRB,按半字操作的指令就是 LDRH 和 STRH。
压栈和出栈指令
我们通常会在 A 函数中调用 B 函数,当 B 函数执行完以后再回到 A 函数继续执行。要想再跳回 A 函数以后代码能够接着正常运行,那就必须在跳到 B 函数之前将当前处理器状态保存起来(就是保存 R0~R15 这些寄存器值),当 B 函数执行完成以后再用前面保存的寄存器值恢复R0~R15 即可。保存 R0~R15 寄存器的操作就叫做现场保护
,恢复 R0~R15 寄存器的操作就叫做恢复现场
。在进行现场保护的时候需要进行压栈
(入栈)操作,恢复现场就要进行出栈
操作。压栈的指令为 PUSH,出栈的指令为 POP, PUSH 和 POP 是一种多存储和多加载指令,即可以一次操作多个寄存器数据,他们利用当前的栈指针 SP 来生成地址, PUSH 和 POP 的用法如表 7.2.3.1所示:
假如我们现在要将 R0~R3 和 R12 这 5 个寄存器压栈,当前的 SP 指针指向 0X80000000,处理器的堆栈是向下增长的,使用的汇编代码如下:
PUSH {R0~R3, R12} @将 R0~R3 和 R12 压栈
图7.2.3.1就是对R0~R3,R12进行压栈以后的堆栈示意图,此时的SP指向了0X7FFFFFEC,假如我们现在要再将 LR 进行压栈,汇编代码如下:
PUSH {LR} @将 LR 进行压栈
图 7.2.3.2 就是分两步对 R0~R3,R12 和 LR 进行压栈以后的堆栈模型,如果我们要出栈的话就是使用如下代码:
POP {LR} @先恢复 LR
POP {R0~R3,R12} @在恢复 R0~R3,R12
出栈的就是从栈顶,也就是 SP 当前执行的位置开始,地址依次减小来提取堆栈中的数据到要恢复的寄存器列表中
。 PUSH 和 POP 的另外一种写法是“STMFD SP!”和“LDMFD SP!”,上面的代码可以改写为:
STMFD SP!,{R0~R3, R12} @R0~R3,R12 入栈
STMFD SP!,{LR} @LR 入栈
LDMFD SP!, {LR} @先恢复 LR
LDMFD SP!, {R0~R3, R12} @再恢复 R0~R3, R12
STMFD 可以分为两部分: STM 和 FD,同理, LDMFD 也可以分为 LDM 和 FD。前面我们讲了 LDR 和 STR,这两个是数据加载和存储指令
,但是每次只能读写存储器中的一个数据
。STM 和 LDM
就是多存储和多加载
,可以连续的读写存储器中的多个连续数据
。
FD 是 Full Descending 的缩写,即满递减的意思。根据 ATPCS 规则,ARM 使用的 FD 类型的堆栈, SP 指向最后一个入栈的数值,堆栈是由高地址向下增长的
,也就是前面说的向下增长的堆栈,因此最常用的指令就是 STMFD 和 LDMFD。 STM 和 LDM 的指令寄存器列表中编号小的对应低地址
,编号高的对应高地址
。
跳转指令
有多种跳转操作,比如:
- 直接使用跳转指令 B、 BL、 BX 等。
- 直接向 PC 寄存器里面写入数据。
B指令
这是最简单的跳转指令, B 指令会将 PC 寄存器的值设置为跳转目标地址
, 一旦执行 B 指令, ARM 处理器就会立即跳转到指定的目标地址。如果要调用的函数不会再返回到原来的执行处
,那就可以用 B 指令
,如下示例:
_start:
ldr sp,=0X80200000 @设置栈指针
b main @跳转到 main 函数
上述代码就是典型的在汇编中初始化 C 运行环境,然后跳转到 C 文件的 main 函数中运行,上述代码只是初始化了 SP 指针,有些处理器还需要做其他的初始化,比如初始化 DDR 等等。因为跳转到 C 文件以后再也不会回到汇编了,所以在第 3行使用了 B 指令来完成跳转。
BL指令
BL 指令相比 B 指令,在跳转之前会在寄存器 LR(R14)中保存当前 PC
寄存器值,所以可以通过将 LR 寄存器
中的值重新加载到 PC
中来继续
从跳转之前的代码处运行
,这是子程序调用一个基本但常用的手段。比如 Cortex-A 处理器的 irq 中断服务函数都是汇编写的,主要用汇编来实现现场的保护和恢复、获取中断号等。但是具体的中断处理过程都是 C 函数,所以就会存在汇编中调用 C 函数的问题。而且当 C 语言版本的中断处理函数执行完成以后是需要返回到irq 汇编中断服务函数,因为还要处理其他的工作,一般是恢复现场。这个时候就不能直接使用B 指令了,因为 B 指令一旦跳转就再也不会回来了,这个时候要使用 BL 指令。
算术运算指令
逻辑运算指令
学习笔记参考与:正点原子《Linux驱动开发指南》