嵌入式杂谈之GNU汇编进阶

接触嵌入式以来,汇编来来回回学了好几遍,感觉还是有几个地方不清楚,所以在这里做一下总结,基本的非常简单的指令就不多余介绍了,主要分享一些个人觉得虽然微不足道,但是对于理解ARM汇编有帮助的一些知识

在这里一定要说一下,刚开始学的时候步入了一个大坑,我以为我学的是ARM汇编,后来了解到了,原来是GNU汇编,怪不得我有些问题去网上找的时候迷迷糊糊的,直到最近才纠正过来

所以首先就是介绍一下这两种汇编有什么区别

ARM汇编与GNU汇编区别

ARM汇编开发,有两种开发方式,一种是使用ARM汇编,一种是使用ARM GNU汇编。
两种汇编开发,使用的汇编指令是完全一样的。
区别是宏指令,伪指令,伪操作不一样。
有上述区别的原因就是 两种开发方式所使用的编译工具不一样。

在指令表示方面:
ARM汇编指令都是大写
GNU汇编指令都是小写

两种常用的ARM的编译开发环境
DS5、MDK、keil:ARM提供的集成开发软件。使用的是ARM提供的工具链进行程序编译。
GNU开发环境: 由GNU的汇编器as,交叉编译器gcc,和链接器ld等组成。

因为我们使用的是GNU的交叉编译工具链,所以我们使用GNU汇编。

虽说我们使用GNU汇编,但我开始学错了,记了好多ARM汇编的笔记,在这里也分享出来(主要是不能浪费了),然后会将ARM汇编与GNU汇编的异同列举出来,大家对照着看完的话会有不一样的收获

完整汇编语句(适用于ARM汇编与GNU汇编)

汇编语言局限于硬件平台
以下面不同平台举例(68k为摩托罗拉的一个架构)

# 向一个寄存器中的一个值加100
x86: add eax, #100
68k: ADD #100,d0
ARM: add r0, r0, 100

ARM汇编指令格式

Operation{cond}{s} Rd, Rn, Operand2
# 一条汇编指令可分为6个部分,存在2个可选项
#1. Operation 表示操作指令
#2. {cond} 可选项,表示条件,例如 eq(相等)
#3. {s} 可选项,表示状态,例如 n z 也就是上文提到的CPSR寄存器的标志位
#4. Rd 英文rigister direction 即 目标寄存器
#5. Rn 即 源寄存器
#6. 后续附加操作

接下来将上面的完整的汇编指令引申到32位的二进制指令
所以汇编与二进制指令是一一对应的关系

# 可能有错误,但意思是这么个意思
[7:0]表示 Operand2
[11:8] 表示 Rn
[15:12] 表示 Rd
[19:16] 表示 s
[24:20] 表示 cond
[27:25] 为保留
[31:28] 表示 Operation
汇编入口(只适用于ARM汇编)
# 下面一行表示 名字叫做 (Example) 的 (只读 READONLY) (代码 CODE) (区域 AREA)
AREA Example, CODE, REANONLY
# 下面一行ENTRY 表示入口
ENTYR
# 下面一行 表示32位编码,与16位的Thumb编码对应
CODE32
# 下面一行表示 固有label标号,表示代码在这里开始执行
START 
	汇编指令
# 下面一行 表示代码结束
END
状态码status

这里也需要结合上文ARM体系结构提到的CPSR寄存器

FlagBitName
N31Negative
Z30Zero
C29Carry
V28Overflow

status码也紧跟在操作码以后
例如 MOVC 表示 先进位再操作

寻址方式
单寄存器访问
  1. 立即数寻址
    ADD R0,R0,#0X3F
    立即数即代表一个数字,
    立即数寻址表示在寄存器与一个数字之间操作

  2. 寄存器寻址
    ADD R0,R1,R2
    只在寄存器之间操作,不涉及内存。
    内存靠地址寻找,寄存器靠名字寻找

  3. 寄存器间接寻址
    ADD与MOV指令只能操作寄存器,不能操作内存,操作内存使用LDR与STR指令
    MOV指令 可以在寄存器之间传输数据,也可以将立即数传输到寄存器
    使用如下指令使数据在内存与寄存器之间传递
    LDR R0,[R1] 表示将R1对应内存的数据放到R0
    STR R0,[R1] 表示将R0里面的数据放到R1对应的内存
    c语言中指针的解引用也使用这种方式

  4. 寄存器移位寻址
    ADD R3,R2,R1,LSL#2 表示R1左移两位加上R2再赋值给R3,LSL表示左移

  5. 基址地址寻址
    LDR R0,[R1,#4] 表示R1地址加4的地址处的值放到R0
    LDR R0,[R1],#4 表示R1地址处的值取出再加4放到R0
    LDR R0,[R1,R2] 表示R1加R2对应的内存地址的值放到R0

  6. 相对寻址
    BL NEXT 表示跳转到NEXT,并且保存跳转前的地址到LR寄存器
    相当于计算pc指针的偏移量来进行跳转

多寄存器内存访问

原型:
STM
LDM

变种:
STMIA xx {xx} 表示将后面连续寄存器地址的值写入前面所指的内存中去
LDMIA xx {xx} 表示读取前面所指内存的值放到后面连续的寄存器中

这里一定要注意单寄存器与多寄存器的存取方向是正好相反的

数据块模式:
A 表示 after 传送前
B 表示 before 传送后
I 表示 increase 自增4字节
D 表示 decrease 递减4字节
IA 表示传送前地址加4
IB 表示传送后地址加4
DA 表示传输前地址减4
DB 表示传输后地址减4
默认情况下
STM = STMIA
LDM = LDRIA

堆栈模式:
也是多寄存器寻址的方式
但是多寄存器寻址的位置是任意的
ldria sp! {xxx} 表示在堆栈上连续读取多个数据到寄存器
是一种压栈和出栈的实现方式

跳转指令

长指令跳转,直接操作pc寄存器
短指令跳转,使用bl 或者 b 进行跳转

b与bl与bx

b相当于c语言中的goto语句,不回到原来地方

bl相当于将当前地址放入lr寄存器,执行完以后最后一句为mov pc, lr跳回原来的地址继续执行

bx表示带模式跳转,返回原有的模式(例如超级模式)

MRS 与 MSR 记忆方法

这是操作CPSR寄存器的两个命令,具体使用方法不做过多介绍
MRS 表示 Move to Register from Status register英文的其中几个简写

MSR 表示 Move to Status register from Register 英文的其中几个简写

arm汇编伪指令

虽然汇编指令可以实现循环以及跳转等各种工作,但比较繁琐
所以使用带参数宏的方法来实现一些伪指令
伪指令只在汇编器之前作用,汇编之后会翻译成标准的汇编指令集
伪指令分为arm汇编伪指令与GNU汇编伪指令
下面均为 ARM汇编 伪指令
两种伪指令对应关系在后面表格列举出来

arm伪指令使用示例描述
AREAAREA test CODE READONLYAREA声明区域段 test是段名称 CODE表示代码段也可以是数据段(DATA) READONLY表示只读,也可以是读写(READWRITE)
CODE16 CODE32CODE32声明以下为32位指令,使用Thumb指令集的时候声明为CODE16
ENTRY用于指定汇编程序的入口点,一个完整的汇编程序(一个工程)至少有一个ENTRY,但存在多个ENTRY的时候由链接器指定入口,但一个源文件最多只能有一个ENTRY(可以没有)
END用于通知编译器已经到了源程序的结尾
EQUADDR EQU 0X3FFD000用于为程序中的常量,标号定义一个等效的名字,类似于#define宏定义,其中EQU可用 * 代替
EXPORT.global也可以代替用于在程序中声明一个全局标号,该标号可在其他文件中引用
IMPORT相当于静态引用用于通知编译器要使用的标号在其它源文件中定义,但无论当前源文件是否引用该标号,该标号均会被加入到当前源文件的符号表中
EXTERN相当于动态引用但如果当前源文件没有引用该标号,该标号不会被加入到当前源文件的符号表中
GET相当于引用文件可以使用INCLUDE 代替 GET
RNname RN 寄存器用来给寄存器定义一个别名

.global 是GNU伪指令,表示全局的标签,对外导出
_start 是GNU伪指令,表示起始地址,类似于我们之前提到的ENTYR

指令后缀

ldrb r0, [r1] 指令意思不变,操作数变为一个字节(byte)(8位)
ldrh r0, [r1] 指令意思不变,操作数变为一个半字(half word)16位
ldrs r0, [r1] 指令意思不变,操作数变为有符号数(signed)
movs r0, #0 默认结果为零但不影响CPSR的Z位,加上s以后会影响CPSR标志位

但是以下指令一定会影响标志位
cmp r0, r1 等价于sub r0, r1, 比较结果是否为零,将CPSR中的 Z 标志位置位
cmn r0, r1 等价于add r0, r1 判断两个数是否互补,比较结果是否为零,将CPSR中的 Z 标志位置位

tst r0, #01 等价于 add r0, #01 用于测试某些位是否为1 ,将CPSR中的 Z 标志位置位
teq r0, r1等价于 eor r0, r1 使用异或判断两个寄存器是否相等,将CPSR中的 Z 标志位置位

条件执行后缀

beq 如果条件成立再进行跳转,条件后缀成立取决于之前代码的运行结果。

上一句代码执行结果影响CPSR的标志位
CPSR标志位决定条件后缀是否成立
具体如下表格

指令条件标志位含义
EQZ置位相等
NEZ清零不相等
CSC置位无符号数大于或等于
CCC清零无符号数小于
MIN置位负数
PLN清零正数或零
VSV置位溢出
VCV清零未溢出
HIC置位Z清零无符号数大于
LSC清零Z置位无符号数小于或等于
GEN等于V带符号数大于或等于
LIN不等于V带符号数小于
GTZ清零且(N等于V)带符号数大于
LEZ置位且(N不等于V)带符号数小于或等于
AL忽略无条件执行

GT表示 greater than
LT表示 lower than
E表示 equal
N表示 not
条件码会紧跟在指令的后面,例如 BEQ表示相等再跳转

GNU汇编中 !

! 表示寄存器自增/自减

因为栈是向下增长的。
STMDB SP! {R0-R3} 表示传输完一个数据以后,SP指针也会自减,相当于 PUSH {R0-R3}
同理 LDMIA SP! {R0-R3} 相当于 POP {R0-R3}

加上感叹号以后相当于sp的值会进行实时更新,不然只是一个临时变量在自加,不会改变sp指针的值。
换句话说,加上感叹号代表sp实时指向栈顶,但是不加的话,数据虽然保存到栈里,但指针还是指向原来的位置。

pc指针

由于三级流水线的关系
pc指向正在被取指的指令
真正被执行的指令为pc - 8

arm伪指令与GNU伪指令的区别
ARM伪指令操作对应的GNU伪指令操作
EXPORT.global
AREA WORD, CODE, READONLY.text
AREA BLOCK, DATE, READWRITE.data
CODE32.arm
CODE16.thumb
END.end
ENTRYENTRY:
IMPORT.extern
RN.req
swi

软中断指令,软件模拟中断用来实现操作系统中的系统调用
中断向量表有一个软中断入口
编写操作系统的人才会用到,普通驱动开发基本用不到

mcr 与 mrc 记忆方法

协处理器操作指令
mrc 是 move to register from cp15 从cp15读取数据
mrc 是 move to cp15 from register 向cp15写入数据
这样记忆起来就特别容易,不至于弄乱顺序

协处理器

coperation processor或者写成 coprocessor

  • soC内部另一个处理核心(不需要CPU参与),协助CPU完成某些功能
  • ARM设计上可以支持16个协处理器,但是我们常用的一般soC只实现其中的cp15(只实现了这一个)
  • 协处理器和MMU、cache、TLB(这三个概念可以查看之前的文章-ARM体系架构)等处理有关
伪指令

伪指令编译以后不生成机器码
伪指令与编译器有关,因为我们使用的是GNU工具链,所以我们使用GNU伪指令

符号:
@用在行后注释
以 : 结尾的是标号
.点号在GNU汇编中表示当前指令地址

# 下面表示一个死循环
flag:
	b flag
# 下面也表示一个死循环
b .

立即数之前要加上#

GNU汇编伪指令

# 声明 _start为外部链接属性
.global _start
# 指定当前段为代码段
.section .text
# 数据类型
.ascii 定义字符
.byte 定义字节
.short 定义两个字节类型数据,相当于c语言中的unsigned short
.word 定义四个字节类型数据 相当于c语言中的unsigned int
.quad 定义八个字节类型数据 
.float 定义四个字节类型的数据 相当于c语言中的float
# 以 2的n次方 进行字节对齐
.align n

下面表示定义一个unsigned int 类型变量 变量名为 a 变量值为123

a:
	.word 123
ldr指令 与 ldr伪指令

ldr指令需要考虑合法立即数与非法立即数
ldr伪指令不需要考虑立即数是否合法

ARM指令只有32位,包括指令标记等,所以32位不能全部用来放数字
所以就有了合法立即数与非法立即数的区别
经过任意位数移位后非零部分可以用8位表示的称为合法立即数
但我们使用的ldr 伪指令,他会自动判断是合法还是非法立即数,如果非法,它会自动转成合法立即数

伪指令与指令的区别在于立即数之前是=还是#
= 表示ldr伪指令
# 表示ldr指令

所以 99% 的情况下都会使用伪指令

寄存器改名

汇编语言的时候直接写这些寄存器的名字就可以
但是芯片厂商也可以自己改变寄存器的名字
方便厂商更加方便的定制
cotex A 系列引入的机制

四种栈
  1. 空栈表示栈顶指针指向最后一个数据的下一个内存位置,相当于栈顶指针指向一个空元素

  2. 满栈表示栈顶指针指向栈顶的最后一个数据,相当于指向一个元素

  3. 增栈
    表示栈的增长是向内存地址高的位置进行增长

  4. 减栈
    表示栈的增长是向内存低的位置进行增长

ARM体系结构正常情况下都是满减栈

c/c++程序中嵌入汇编

格式:
__asm [volatile] {instruction}
限制条件:

  • 不能直接向pc赋值,程序跳转使用b或者bl指令
  • 在使用物理寄存器的时候,不能使用过于复杂的c表达式
  • 尽量使用R0-R7通用寄存器
C语言调用汇编(不常用)
  1. 汇编export
  2. c语言定义 extern function
  3. c语言使用

c语言和汇编语言之间传递参数是通过对应的R0-R3来传递的,即R0第一个参数,以此类推,多于4个参数是借助栈完成,函数返回值通过R0来传递,这个规定叫做ATPCS(ARM Thumb Procedure Call Standard),具体见ATPCS规范

汇编调用c语言
  1. c语言实现函数
  2. 汇编import导入函数名
  3. bl 函数名

了解更多技术文章,欢迎关注我的个人公众号

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值