指令和伪指令
- (汇编)指令时CPU机器指令的助记符,经过编译后会得到一串1-0组成的机器码,可以由CPU读取执行。
- (汇编)伪指令本质上不是指令(只是和指令一起写在代码中),它时编译器环境提供的,目的时用来指导编译过程,经过编译后伪指令最终不会生成机器码
两种不同风格的ARM指令
- ARM官方的ARM汇编风格:指令一般用大写、Windows中IDE开发环境(如ADS、MDK等)常用。如:LDR R0,[R1]
- GNU风格的ARM汇编:指令一般用小写字母、linux中常用。如:ldr r0,[r1]
ARM汇编特点1:LDR/STR架构
- ARM采用RISC架构,CPU本身不能直接读去内存,而需要先将内存中内容加载如CPU中通用寄存器中才能被CPU处理。
- ldr(load register)指令将内存内容加载到通用寄存器
- str(store register)指令将通用寄存器存入内存空间
- ldr/str组合用来实现ARM CPU和内存数据交换
#ARM汇编特点2:8中寻址方式
- 寄存器寻址 mov r1,r2
- 立即寻址 mov r0,#0xFF00
- 寄存器移位寻址 mov r0,r1,lsl #3 (将r1寄存器内容左移3位赋值给r0)
- 寄存器间接寻址 ldr r1,[r2] (将r2指向内存地址的内容赋值给r1)
- 基址变址寻址 ldr r1,[r2, #4] (将r2指向内存地址+4的内容赋值给r1)
- 多寄存器寻址 ldmia r1!,{r2-r7,r12} ( 将r2-r7和r12指向内容地址的内容依次赋值到r1-r7)
- 堆栈寻址 stmfd sp!,{r2-r7,lr}
- 相对寻址 beq flag flag:
ARM汇编特点3:指令后缀
- 同一指令经常附带不同后缀,变成不同的指令。经常使用的后缀有:
- B(Byte)功能不变,操作长度变为8位
- H(half word)功能不变,操作长度为16位
- S(signed)功能不变,操作数变为有符合
- S(S标志)功能不变,影响CPSR标志位
ARM汇编特点4:条件执行后缀
ARM汇编特点5:多级指令流水线
常用ARM指令1:数据处理指令
数据传输指令 MOV MVN
mov r1, r0 @两个寄存器之间传递
mov r1, #0x0 @将立即数赋值给r1
mvn和mov用法一样,区别是mov是原封不动的传递,而mvn是按位取反
例如 r1 = 0x000000ff,mov r0, r1,
算术运算指令
- add
- sub
- rsb
- adc
- abc
- rsc
逻辑指令
- and
- or
- eor
- bic
比较指令
- cmp
- cmn
- tst tst r0, #0xf @测试r0的bit0-bit3是否为0
- teq
乘法指令
- mvl
- mla
- umull
- umlal
- smull
- smlal
前导零计数
clz 看一个数前面有多少个0
cpsr访问指令
- mrs:用来读psr
- msr:用来写psr
cpsr和spsr的区别和联系:cpsr是程序状态寄存器,整个Soc中只有1个;而spsr有5个,分别在5种异常模式中。
跳转(分支)指令
- b 直接跳转
- bl branch and link 跳转前把返回地址放入lr中,以便返回,以便用于函数调用
- bx 跳转同时切换到ARM模式,一般用于异常处理的跳转
访存指令
- 单个字/半字/字节访问 ldr/str
- 多字批量访问
- swp r1, r2, [r0]
- swp r1, r1, [r0]
立即数
- 合法立即数与非法立即数
- ARM指令都是32位,除了指令标记和操作标记外,本身只能附带很少位数的立即数。因此立即数有合法和非法立即数。
- 经过任意位数的移位后非零部分可以用8位表示的即为合法立即数
软中断指令
- swi
- 软中断指令用来实现操作系统中系统调用
协处理器CP15操作指令
mcr & mrc
- mrc用于读取CP15中的寄存器
- mcr用于写入CP15中的寄存器
什么是协处理器
- SoC内部另一个处理核心,协助朱CPU实现某些功能,被被主CPU调用执行一定的任务。
- ARM设计上支持多达16个协处理器,但是一般SoC只实现其中的CP15(CP:coprocessor)
- 协处理器和MMU、cache、TLB等处理有关,功能上和操作系统的虚拟地址映射、cache管理等有关。
为什么需要多寄存器访问指令
ldr/str每周期只能访问4字节内存,如果需要批量读取、写入内存时太慢,解决方案时stm/ldm
举例
- stmia sp, {r0 - r12}
- 将r0存入sp指向的内存处(假设为0x30001000);然后地址+4(即指向0x30001004),将r1存入该地址;然后地址再+4(指向0x30001008),将r2存入该地址……直到r12内容放入(0x30001030),指令完成
- 一个访问周期同时完成13个寄存器的读写
8中后缀
- ia(increase after)先传输,再地址+4
- ib(increase before)先地址+4,再传输
- da(decrease after)先传输,再地址+4
- db(decrease before)先地址-4,再传输
- fd()
- ed()
- fa()
- ea()
四种栈
- 空栈:栈指针指向空位,每次存入时可以直接存入然后栈指针移动一格;而取出时需要先移动一格才能取出
- 满栈:指针指向栈中最后一个数据,每次存入时需要先移动栈指针一个再存入;取出时可以直接取出,然后再移动栈指针
- 增栈:栈指针移动时向地址增加的方向移动
- 减栈:指针以哦对那个地址减小的方向
!的做用
- ldmia r0, {r2 - r3}
- ldmia r0!, {r2 - r3}
- 感叹号的作用就是r0的值在ldm过程中发生的增加或者减少最后写回到r0去,也就是说ldm是会改变r0的值。
^的作用
- ldmfd sp!, {r0 - r6, pc}
- ldmfd sp!, {r0 - r6, pc}^
- ^的作用:在目标寄存器中有pc时,会同时将spsr写入到cpsr
伪指令
- 伪指令不是指令,伪指令和指令的根本区别:经过编译后不会产生机器码
- 伪指令的意义在于指导编译过程
- 伪指令是和具体的编译器相关的,我们使用gnu工具链,因此学校gnu环境下的汇编伪指令
gnu汇编中的一些符号
常用gnu伪指令
- .global _start 给_start外部链接属性
- .section .text 指定当前段为代码段
- .ascii .byte .short .long .word
- .quad .float .string
- .align 4 字节对齐
- .balignl 16, 0xdf546932 对齐 + 填充,b表示位填充,align表示要对齐,l表示long,以4字节位单位填充;16表示16字节对齐;0xdf546932是用来填充的
- .equ 类似于c语言的宏定义
偶尔会用到的gnu伪指令
- .end 表示文件结束
- .include 头文件包含
- .arm / .code32 声明一下为arm指令
- .trumb / .code16 声明为trumb指令
最重要的几个伪指令
- ldr 大范围的地址加载指令
- adr 小范围的地址加载指令
- adrl 中等范围的地址加载指令
- nop 空操作
- adr与ldr的差异:ldr加载的地址在链接时确定,而adr加载的地址在运行时确定,所以我可以通过adr和ldr加载的地址比较来判断当前程序是否在链接时指定的地址运行。