ARM指令集

指令和伪指令

  • (汇编)指令时CPU机器指令的助记符,经过编译后会得到一串1-0组成的机器码,可以由CPU读取执行。
  • (汇编)伪指令本质上不是指令(只是和指令一起写在代码中),它时编译器环境提供的,目的时用来指导编译过程,经过编译后伪指令最终不会生成机器码

两种不同风格的ARM指令

  • ARM官方的ARM汇编风格:指令一般用大写、Windows中IDE开发环境(如ADS、MDK等)常用。如:LDR R0,[R1]
  • GNU风格的ARM汇编:指令一般用小写字母、linux中常用。如:ldr r0,[r1]

ARM汇编特点1:LDR/STR架构

  • ARM采用RISC架构,CPU本身不能直接读去内存,而需要先将内存中内容加载如CPU中通用寄存器中才能被CPU处理。
  • ldr(load register)指令将内存内容加载到通用寄存器
  • str(store register)指令将通用寄存器存入内存空间
  • ldr/str组合用来实现ARM CPU和内存数据交换

#ARM汇编特点2:8中寻址方式

  • 寄存器寻址 mov r1,r2
  • 立即寻址 mov r0,#0xFF00
  • 寄存器移位寻址 mov r0,r1,lsl #3 (将r1寄存器内容左移3位赋值给r0)
  • 寄存器间接寻址 ldr r1,[r2] (将r2指向内存地址的内容赋值给r1)
  • 基址变址寻址 ldr r1,[r2, #4] (将r2指向内存地址+4的内容赋值给r1)
  • 多寄存器寻址 ldmia r1!,{r2-r7,r12} ( 将r2-r7和r12指向内容地址的内容依次赋值到r1-r7)
  • 堆栈寻址 stmfd sp!,{r2-r7,lr}
  • 相对寻址 beq flag flag:

ARM汇编特点3:指令后缀

  • 同一指令经常附带不同后缀,变成不同的指令。经常使用的后缀有:
  • B(Byte)功能不变,操作长度变为8位
  • H(half word)功能不变,操作长度为16位
  • S(signed)功能不变,操作数变为有符合
  • S(S标志)功能不变,影响CPSR标志位

ARM汇编特点4:条件执行后缀

ARM汇编特点5:多级指令流水线

常用ARM指令1:数据处理指令

数据传输指令 MOV MVN

mov r1, r0 @两个寄存器之间传递
mov r1, #0x0 @将立即数赋值给r1

mvn和mov用法一样,区别是mov是原封不动的传递,而mvn是按位取反
例如 r1 = 0x000000ff,mov r0, r1,

算术运算指令

  • add
  • sub
  • rsb
  • adc
  • abc
  • rsc

逻辑指令

  • and
  • or
  • eor
  • bic

比较指令

  • cmp
  • cmn
  • tst tst r0, #0xf @测试r0的bit0-bit3是否为0
  • teq

乘法指令

  • mvl
  • mla
  • umull
  • umlal
  • smull
  • smlal

前导零计数

clz 看一个数前面有多少个0

cpsr访问指令

  • mrs:用来读psr
  • msr:用来写psr

cpsr和spsr的区别和联系:cpsr是程序状态寄存器,整个Soc中只有1个;而spsr有5个,分别在5种异常模式中。

跳转(分支)指令

  • b 直接跳转
  • bl branch and link 跳转前把返回地址放入lr中,以便返回,以便用于函数调用
  • bx 跳转同时切换到ARM模式,一般用于异常处理的跳转

访存指令

  • 单个字/半字/字节访问 ldr/str
  • 多字批量访问
  • swp r1, r2, [r0]
  • swp r1, r1, [r0]

立即数

  • 合法立即数与非法立即数
  • ARM指令都是32位,除了指令标记和操作标记外,本身只能附带很少位数的立即数。因此立即数有合法和非法立即数。
  • 经过任意位数的移位后非零部分可以用8位表示的即为合法立即数

软中断指令

  • swi
  • 软中断指令用来实现操作系统中系统调用

协处理器CP15操作指令

mcr & mrc

  • mrc用于读取CP15中的寄存器
  • mcr用于写入CP15中的寄存器

什么是协处理器

  • SoC内部另一个处理核心,协助朱CPU实现某些功能,被被主CPU调用执行一定的任务。
  • ARM设计上支持多达16个协处理器,但是一般SoC只实现其中的CP15(CP:coprocessor)
  • 协处理器和MMU、cache、TLB等处理有关,功能上和操作系统的虚拟地址映射、cache管理等有关。

为什么需要多寄存器访问指令

ldr/str每周期只能访问4字节内存,如果需要批量读取、写入内存时太慢,解决方案时stm/ldm

举例

  • stmia sp, {r0 - r12}
  • 将r0存入sp指向的内存处(假设为0x30001000);然后地址+4(即指向0x30001004),将r1存入该地址;然后地址再+4(指向0x30001008),将r2存入该地址……直到r12内容放入(0x30001030),指令完成
  • 一个访问周期同时完成13个寄存器的读写

8中后缀

  • ia(increase after)先传输,再地址+4
  • ib(increase before)先地址+4,再传输
  • da(decrease after)先传输,再地址+4
  • db(decrease before)先地址-4,再传输
  • fd()
  • ed()
  • fa()
  • ea()

四种栈

  • 空栈:栈指针指向空位,每次存入时可以直接存入然后栈指针移动一格;而取出时需要先移动一格才能取出
  • 满栈:指针指向栈中最后一个数据,每次存入时需要先移动栈指针一个再存入;取出时可以直接取出,然后再移动栈指针
  • 增栈:栈指针移动时向地址增加的方向移动
  • 减栈:指针以哦对那个地址减小的方向

!的做用

  • ldmia r0, {r2 - r3}
  • ldmia r0!, {r2 - r3}
  • 感叹号的作用就是r0的值在ldm过程中发生的增加或者减少最后写回到r0去,也就是说ldm是会改变r0的值。

^的作用

  • ldmfd sp!, {r0 - r6, pc}
  • ldmfd sp!, {r0 - r6, pc}^
  • ^的作用:在目标寄存器中有pc时,会同时将spsr写入到cpsr

伪指令

  • 伪指令不是指令,伪指令和指令的根本区别:经过编译后不会产生机器码
  • 伪指令的意义在于指导编译过程
  • 伪指令是和具体的编译器相关的,我们使用gnu工具链,因此学校gnu环境下的汇编伪指令

gnu汇编中的一些符号

常用gnu伪指令

  • .global _start 给_start外部链接属性
  • .section .text 指定当前段为代码段
  • .ascii .byte .short .long .word
  • .quad .float .string
  • .align 4 字节对齐
  • .balignl 16, 0xdf546932 对齐 + 填充,b表示位填充,align表示要对齐,l表示long,以4字节位单位填充;16表示16字节对齐;0xdf546932是用来填充的
  • .equ 类似于c语言的宏定义

偶尔会用到的gnu伪指令

  • .end 表示文件结束
  • .include 头文件包含
  • .arm / .code32 声明一下为arm指令
  • .trumb / .code16 声明为trumb指令

最重要的几个伪指令

  • ldr 大范围的地址加载指令
  • adr 小范围的地址加载指令
  • adrl 中等范围的地址加载指令
  • nop 空操作
  • adr与ldr的差异:ldr加载的地址在链接时确定,而adr加载的地址在运行时确定,所以我可以通过adr和ldr加载的地址比较来判断当前程序是否在链接时指定的地址运行。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值