Coretx-A9 MPCore知识

摘抄自正点原子哥的文档。
一、Coretx-A9 MPCore 架构
Cortex-A9 处理器是一个具有双发射,长度可变的、动态分支预测的乱序超标量体系结构的多核处理器,具有可配置的缓存和使用 ACP 端口的系统一致性。在单核配置中,Cortex-A9处理器的性能比 Cortex-A8 处理器高出 50%以上。
Cortex-A9 MPCore 使用 ARMv7-A 指令集架构,主要特性如下:
(1)、先进的单指令多数据(SIMD)体系结构扩展,用于整数和浮点向量运算。
(2)、提供了与 ARM VFPv3 体系结构兼容的高性能的单双精度浮点指令,支持全功能的IEEE754。
(3)、增强安全性的安全性扩展。
(4)、支持硬件虚拟化。
(5)、带有存储器管理单元(MMU)的哈佛 1 级存储器系统。
(6)、支持 NEON,可以加速多媒体和信号处理算法。
1、Cortex-A 处理器运行模型
Cortex-A 就有 9 种运行模式:User、FIQ、IRQ、Supervisor(SVC)、Abort、Undef和 System、Monitor、Hyp。
当中断或者异常发生以后,处理器就会进入到相应的异常模式中。每一种异常模式都有一组寄存器供异常处理程序使用,以保证在进入异常模式以后,用户模式下的寄存器不会被破坏。
2、Cortex-A 寄存器组
每一种运行模式都有一组与之对应的寄存器组。ARM 架构提供了 16 个 32 位的通用寄存器(R0~R15)供软件使用,前 15 个(R0~R14)可以用作通用的数据存储,R15 是程序计数器 PC,用来保存将要执行的指令。ARM 还提供了一个当前程序状态寄存器 CPSR(Current Program Status Register)和一个备份程序状态寄存器SPSR(Saved Program Status Register),SPSR 寄存器是 CPSR 寄存器的备份。
2.1程序计数器 R 15
程序计数器 R15 也叫做 PC(program counter),在 ARM 状态下,R15 始终指向当前指令之前的八个字节,在 Thumb 状态下,它始终指向当前指令之前的四个字节,这是因为 ARM 的流水线机制导致的。ARM 处理器 3 级流水线:取指->译码->执行,这三级流水线循环执行,比如当前正在执行第一条指令的同时也对第二条指令进行译码,第三条指令也同时被取出存放在 R15(PC)中。我们喜欢以当前正在执行的指令作为参考点,也就是以第一条指令为参考点,那么 R15(PC)中存放的就是第三条指令,换句话说就是 R15(PC)总是指向当前正在执行的指令地址再加上 2 条指令的地址。对于 32 位的 ARM 处理器,每条指令是 4 个字节,所以:
R15 (PC)值 = 当前执行的程序位置 + 8 个字节。
二、ARM 汇编基础
ARM 处理器的指令集可以分为跳转指令、数据处理指令、程序状态寄存器(PSR)传输指令、加载/存储指令、协处理器指令和异常产生指令 6 大类。
Cortex-A9 使用的是 ARMv7-A 指令集。
对于 Cortex-A 芯片来讲,大部分芯片在上电以后 C 语言环境还没准备好,所以第一行程序肯定是汇编的,至于要写多少汇编程序,那就看你能在哪一步把 C 语言环境准备好。所谓的 C 语言环境就是保证 C 语言能够正常运行。C 语言中的函数调用涉及到出栈入栈,出栈入栈就要对堆栈进行操作,所谓的堆栈其实就是一段内存,这段内存比较特殊,由 SP 指针访问,SP 指针指向栈顶。芯片一上电 SP 指针还没有初始化,所以 C 语言没法运行,对于有些芯片还需要初始化 DDR,因为芯片本身没有 RAM,或者内部 RAM 不开放给用户使用,用户代码需要在 DDR 中运行,因此一开始要用汇编来初始化 DDR 控制器。
学习 Uboot 和 Linux 内核的时候汇编是必须要会的。
1、GNU 汇编语法
GNU 汇编语法适用于所有的架构,并不是 ARM 独享的,GNU 汇编由一系列的语句组成,每行一条语句,每条语句有三个可选部分,如下:
label:instruction @ comment
label 即标号,表示地址位置,有些指令前面可能会有标号,这样就可以通过这个标号得到指令的地址,标号也可以用来表示数据地址。注意 label 后面的冒号“:”,任何以冒号“:”结尾的标识符都会被认识是一个标号。
instruction 即指令,也就是汇编指令或伪指令。
@符号,表示后面的是注释,就跟 C 语言里面的“/”和“/”一样,其实在 GNU 汇编文件中我们也可以使用“/”和“/”来注释。commtent 就是注释内容。
比如如下代码:
add:
MOVS R0, #0X12 @设置 R0=0X12
上面代码中“add:”就是标号,“MOVS R0,#0X12”就是指令,最后的“@设置 R0=0X12”
就是注释。
注意:ARM 中的指令、伪指令、伪操作、寄存器名等可以全部使用大写,也可以全部使用小写,但是不能大小写混用。
用户可以使用.section 伪操作来定义一个段,汇编系统预定义了一些段名:
.text 表示代码段。
.data 初始化的数据段。
.bss 未初始化的数据段。
.rodata 只读数据段。
我们当然可以自己使用.section 来定义一个段,每个段以段名开始,以下一段名或者文件结尾结束,比如:
.section .testsection @定义一个 testsetcion 段
汇编程序的默认入口标号是_start,不过我们也可以在链接脚本中使用 ENTRY 来指明其它的入口点,下面的代码就是使用_start 作为入口标号:
.global _start
_start:
ldr r0, =0x12 @r0=0x12
上面代码中.global 是伪操作,表示_start 是一个全局标号,类似 C 语言里面的全局变量一样,常见的伪操作有:
.byte 定义单字节数据,比如.byte 0x12。
.short 定义双字节数据,比如.byte 0x1234。
.long 定义一个 4 字节数据,比如.long 0x12345678。
.equ 赋值语句,格式为:.equ 变量名,表达式,比如.equ num, 0x12,表示
num=0x12。
.align 数据字节对齐,比如:.align 4 表示 4 字节对齐。
. end 表示源文件结束。
.global 定义一个全局符号,格式为:.global symbol,比如:.global _start。
GNU 汇编同样也支持函数,函数格式如下:
函数名:
函数体
返回语句
GNU 汇编函数返回语句不是必须的,如下代码就是用汇编写的 Cortex-A9 中断服务函数:
/* 未定义中断 /
Undefined_Handler:
ldr r0, =Undefined_Handler
bx r0
/
SVC 中断 /
SVC_Handler:
ldr r0, =SVC_Handler
bx r0
/
预取终止中断 */
PrefAbort_Handler:
ldr r0, =PrefAbort_Handler
bx r0
上述代码中定义了三个汇编函数:Undefined_Handler、SVC_Handler 和 PrefAbort_Handler。以函数 Undefined_Handler 为例我们来看一下汇编函数组成, “Undefined_Handler”就是函数名,“ldr r0, =Undefined_Handler”是函数体,“bx r0”是函数返回语句,“bx”指令是返回指令,函数返回语句不是必须的。
2、Cortex-A9 常用汇编指令
2.1 处理器内部数据传输指令
使用处理器做的最多事情就是在处理器内部来回的传递数据,常见的操作有:
(1)、将数据从一个寄存器传递到另外一个寄存器。
(2)、将数据从一个寄存器传递到特殊寄存器,如 CPSR 和 SPSR 寄存器。
(3)、将立即数传递到寄存器。
数据传输常用的指令有三个:MOV、MRS 和 MSR,
指令 目的 源 描述
MOV R0 R1 将 R1 里面的数据复制到 R0 中。
MRS R0 CPSR 将特殊寄存器 CPSR 里面的数据复制到 R0 中。
MSR CPSR R1 将 R1 里面的数据复制到特殊寄存器 CPSR 里中。
分别来详细的介绍一下如何使用这三个指令:
1、MOV 指令
MOV 指令用于将数据从一个寄存器拷贝到另外一个寄存器,或者将一个立即数传递到寄存器里面,使用示例如下:
MOV R0,R1 @将寄存器 R1 中的数据传递给 R0,即 R0=R1
MOV R0, #0X12 @将立即数 0X12 传递给 R0 寄存器,即 R0=0X12
2、MRS 指令
MRS 指令用于将特殊寄存器(如 CPSR 和 SPSR)中的数据传递给通用寄存器,要读取特殊寄存器的数据只能使用 MRS 指令。使用示例如下:
MRS R0, CPSR @将特殊寄存器 CPSR 里面的数据传递给 R0,即 R0=CPSR
3、MSR 指令
MSR 指令和 MRS 刚好相反,MSR 指令用来将普通寄存器的数据传递给特殊寄存器,也就是写特殊寄存器,写特殊寄存器只能使用 MSR,使用示例如下:
MSR CPSR, R0 @将 R0 中的数据复制到 CPSR 中,即 CPSR=R0
2.2 存储器访问指令
ARM 不能直接访问存储器,比如 RAM 中的数据,ZYNQ 中的寄存器就是 RAM 类型的,我们用汇编来配置 ZYNQ 寄存器的时候需要借助存储器访问指令,一般先将要配置的值写入到Rx(x=0~12)寄存器中,然后借助存储器访问指令将 Rx 中的数据写入到 ZYNQ 寄存器中。读取ZYNQ 寄存器也是一样的,只是过程相反。常用的存储器访问指令有两种:LDR 和 STR,用法如下表所示:
指令 描述
LDR Rd, [Rn , #offset] 从存储器 Rn+offset 的位置读取数据存放到 Rd 中。
STR Rd, [Rn, #offset] 将 Rd 中的数据写入到存储器中的 Rn+offset 位置。
分别来详细的介绍一下如何使用这两个指令:
2.2.1、 LDR 指令
LDR 主要用于从存储加载数据到寄存器 Rx 中,LDR 也可以将一个立即数加载到寄存器 Rx中,LDR 加载立即数的时候要使用“=”,而不是“#”。在嵌入式开发中,LDR 最常用的就是读取 CPU 的寄存器值,比如 ZYNQ 有个寄存器 XGPIOPS_DIRM_OFFSET,其地址为 0xE000A204,我们现在要读取这个寄存器中的数据,示例代码如下:
示例代码 LDR 指令使用
LDR R0, = 0xE000A204 @将寄存器地址 0xE000A204 加载到 R0 中,即 R0= 0xE000A204
LDR R1, [R0] @读取地址 0xE000A204 中的数据到 R1 寄存器中
上述代码就是读取寄存器 XGPIOPS_DIRM_OFFSET 中的值,读取到的寄存器值保存在 R1 寄存器中。
2.2. 2、STR 指令
LDR 是从存储器读取数据,STR 就是将数据写入到存储器中,同样以 ZYNQ 寄存器XGPIOPS_DIRM_OFFSET 为例,现在我们要配置寄存器 XGPIOPS_DIRM_OFFSET 的值为0X2000002,示例代码如下:
示例代码 STR 指令使用
LDR R0, = 0xE000A204 @将寄存器地址 0xE000A204 加载到 R0 中,即 R0= 0xE000A204
LDR R1, =0X20000002 @R1 保存要写入到寄存器的值,即 R1=0X20000002
STR R1, [R0] @将 R1 中的值写入到 R0 中所保存的地址中
LDR 和 STR 都是按照字进行读取和写入的,也就是操作的 32 位数据,如果要按照字节、半字进行操作的话可以在指令“LDR”后面加上 B 或 H,比如按字节操作的指令就是 LDRB 和STRB,按半字操作的指令就是 LDRH 和 STRH。
2.2. 3、压栈和出栈指令
我们通常会在 A 函数中调用 B 函数,当 B 函数执行完以后再回到 A 函数继续执行。要想在跳回 A 函数以后代码能够接着正常运行,那就必须在跳到 B 函数之前将当前处理器状态保存起来(就是保存 R0~R15 这些寄存器值),当 B 函数执行完成以后再用前面保存的寄存器值恢复 R0~R15 即可。保存 R0~R15 寄存器的操作就叫做现场保护,恢复 R0~R15 寄存器的操作就叫做恢复现场。在进行现场保护的时候需要进行压栈(入栈)操作,恢复现场就要进行出栈操作。压栈的指令为 PUSH,出栈的指令为 POP,PUSH 和 POP 是一种多存储和多加载指令,也就是可以一次操作多个寄存器数据,它们利用当前的栈指针 SP 来生成地址,PUSH 和 POP 的用法如下表所示:
指令 描述
PUSH 将寄存器列表存入栈中。
POP 从栈中恢复寄存器列表。
假如我们现在要将 R0~R3 和 R12 这 5 个寄存器压栈,当前的 SP 指针指向 0X80000000,处理器的堆栈是向下增长的,使用的汇编代码如下:
PUSH {R0~R3, R12} @将 R0~R3 和 R12 压栈
压栈完成以后的堆栈如下图所示:
在这里插入图片描述

上图就是对 R0~R3,R12 进行压栈以后的堆栈示意图,此时的 SP 指向了 0X7FFFFFEC,假如我们现在要再将 LR 进行压栈,汇编代码如下:
PUSH {LR} @将 LR 进行压栈
对 LR 进行压栈完成以后的堆栈模型如下图所示:
在这里插入图片描述

上图就是分两步对 R0~R3,R2 和 LR 进行压栈以后的堆栈模型,如果我们要出栈的话就是使用如下代码:
POP {LR} @先恢复 LR
POP {R0~R3,R12} @在恢复 R0~R3,R12
出栈的就是从栈顶,也就是 SP 当前执行的位置开始,地址依次减小来提取堆栈中的数据到要恢复的寄存器列表中。PUSH 和 POP 的另外一种写法是“STMFD SP!”和“LDMFD SP!”,因此上面的汇编代码可以改为:
STMFD SP!,{R0~R3, R12} @R0~R3,R12 入栈
STMFD SP!,{LR} @LR 入栈

LDMFD SP!, {LR} @先恢复 LR
LDMFD SP!, {R0~R3, R12} @在恢复 R0~R3, R12

STMFD 可以分为两部分:STM 和 FD,同理,LDMFD 也可以分为 LDM 和 FD。看到 STM 和 LDM有没有觉得似曾相识,前面我们讲了 LDR 和 STR,这两个是数据加载和存储指令,但是每次只能读写存储器中的一个数据。STM 和 LDM 就是多加载和多存储,可以连续的读写存储器中的多个连续数据。
FD 是 Full Descending 的缩写,即满递减的意思。根据 ATPCS 规则,ARM 使用的 FD 类型的堆栈,SP 指向最后一个入栈的数值,堆栈是由高地址向下增长的,也就是前面说的向下增长的堆栈,因此最常用的指令就是 STMFD 和 LDMFD。STM 和 LDM 的指令寄存器列表中编号小的对应低地址,编号高的对应高地址。
2.2.4、跳转指令
有多种跳转操作,比如:
(1)、直接使用跳转指令 B、BL、BX 等。
(2)、直接向 PC 寄存器里面写入数据。
上述两种方法都可以完成跳转操作,但是一般常用的还是 B、BL 或 BX,用法如下表:
指令 描述
B

在嵌入式开发中最常会用的就是加减指令,乘除基本用不到。
2.2.4. 6、逻辑运算指令
我们用 C 语言进行 CPU 寄存器配置的时候常常需要用到逻辑运算符号,比如“&”、“|”等逻辑运算符。使用汇编语言的时候也可以使用逻辑运算指令,常用的运算指令用法如下表所示:
在这里插入图片描述
在这里插入图片描述

逻辑运算指令都很好理解,ARM 汇编就讲解到这里,本节主要讲解了一些最常用的指令,还有很多不常用的指令没有讲解,但是够我们学习用了。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值