ARM汇编指令的一些总结

最新推荐文章于 2023-06-17 11:34:38 发布

jiaoxiaomin

最新推荐文章于 2023-06-17 11:34:38 发布

阅读量1.5k

点赞数

文章标签：汇编 linux内核存储存储系统编译器工作

本文链接：https://blog.csdn.net/jiaoxiaomin/article/details/1784690

版权

ARM 汇编指令的一些总结

ARM 汇编指令很多，但是真正常用的不是很多，而且需要认真琢磨的又更少了。

比较有用的是 MOV B BL LDR STR

还是通过具体汇编代码来学习吧。

@ disable watch dog timer

mov r1, #0x53000000 // 立即数寻址方式

mov r2, #0x0

str r2, [r1]

MOV 没有什么好说的，只要掌握几个寻址方式就可以了，而且 ARM 的寻址方式比 386 的简单很多。立即数寻址方式，立即数要求以“ # ” 作前缀，对于十六进制的数，还要求在 # 后面加上 0x 或者 & 。 0x 大家很好理解。有一次我碰到了 &ff 这个数，现在才明白跟 0xff 是一样的。

STR 是比较重要的指令了，跟它对应的是 LDR 。 ARM 指令集是加载 / 存储型的，也就是说它只处理在寄存器中的数据。那么对于系统存储器的访问就经常用到 STR 和 LDR 了。 STR 是把寄存器上的数据传输到指定地址的存储器上。它的格式我个人认为很特殊：

STR( 条件 ) 源寄存器， < 存储器地址 >

比如 STR R0, [R1] ，意思是 R0-> [R1] ，它把源寄存器写在前面，跟 MOV 、 LDR 都相反。

LDR 应该是非常常见了。 LDR 就是把数据从存储器传输到寄存器上。而且有个伪指令也是 LDR ，因此我有个百思不得其解的问题。看这段代码：

mov r1, #GPIO_CTL_BASE

add r1, r1, #oGPIO_F

ldr r2,=0x55aa // 0x55aa 是个立即数啊，前面加个=干什么？

str r2, [r1, #oGPIO_CON]

mov r2, #0xff

str r2, [r1, #oGPIO_UP]

mov r2, #0x00

str r2, [r1, #oGPIO_DAT]

对于当中的 ldr 那句，我就不明白了，如果你把 = 去掉，是不能通过编译的。我查了一些资料，个人感觉知道了原因：这个 = 应该表示 LDR 不是 ARM 指令，而是伪指令。 作为伪指令的时候， LDR 的格式如下：

LDR 寄存器， = 数字常量 /Label

它的作用是把一个 32 位的地址或者常量调入寄存器。嗬嗬，那大家可能会问，

“ MOV r2,#0x55aa ” 也可以啊。应该是这样的。不过， LDR 是伪指令啊，也就是说编译时编译器会处理它的。怎么处理的呢？——规则如下：如果该数字常量在 MOV 指令范围内，汇编器会把这个指令作为 MOV 。如果不在 MOV 范围中，汇编器把该常量放在程序后面，用 LDR 来读取， PC 和该常量的偏移量不能超过 4KB 。

这么一说，虽然似懂非懂，但是能够解释这个语句了。

然后说一下跳转指令。 ARM 有两种跳转方式。

（ 1 ） mov pc < 跳转地址〉

这种向程序计数器 PC 直接写跳转地址，能在 4GB 连续空间内任意跳转。

（ 2 ）通过 B BL BLX BX 可以完成在当前指令向前或者向后 32MB 的地址空间的跳转（为什么是 32MB 呢？寄存器是 32 位的，此时的值是 24 位有符号数，所以 32MB ）。

B 是最简单的跳转指令。要注意的是，跳转指令的实际值不是绝对地址，而是相对地址——是相对当前 PC 值的一个偏移量，它的值由汇编器计算得出。

BL 非常常用。它在跳转之前会在寄存器 LR(R14) 中保存 PC 的当前内容。 BL 的经典用法如下：

bl NEXT ; 跳转到NEXT

……

NEXT

……

mov pc, lr ; 从子程序返回。

最后提一下 Thumb 指令。 ARM 体系结构还支持 16 位的 Thumb 指令集。 Thumb 指令集是 ARM 指令集的子集，它保留了 32 位代码优势的同时还大大节省了存储空间。由于 Thumb 指令集的长度只有 16 位，所以它的指令比较多。它和 ARM 各有自己的应用场合。对于系统性能有较高要求，应使用 32 位存储系统和 ARM 指令集；对于系统成本和功耗有较高要求，应使用 16 位存储系统和 ARM 指令集。

对ARM异常（Exceptions）的理解

分类:技术笔记

毕设笔记

1 ．对 ARM 异常（ Exceptions ）的理解

所有的系统引导程序前面中会有一段类似的代码，如下：

.globl _start ；系统复位位置

_start: b reset ；各个异常向量对应的跳转代码

ldr pc, _undefined_instruction ；未定义的指令异常

ldr pc, _software_interrupt ；软件中断异常

ldr pc, _prefetch_abort ；内存操作异常

ldr pc, _data_abort ；数据异常

ldr pc, _not_used ；未使用

ldr pc, _irq ；慢速中断异常

ldr pc, _fiq ；快速中断异常

从中我们可以看出， ARM 支持 7 种异常。问题时发生了异常后 ARM 是如何响应的呢？第一个复位异常很好理解，它放在 0x0 的位置，一上电就执行它，而且我们的程序总是从复位异常处理程序开始执行的，因此复位异常处理程序不需要返回。那么怎么会执行到后面几个异常处理函数呢？

看看书后，明白了 ARM 对异常的响应过程，于是就能够回答以前的这个疑问。

当一个异常出现以后， ARM 会自动执行以下几个步骤：

（ 1 ）把下一条指令的地址放到连接寄存器 LR( 通常是 R14) ，这样就能够在处理异常返回时从正确的位置继续执行。

（ 2 ）将相应的 CPSR( 当前程序状态寄存器 ) 复制到 SPSR （备份的程序状态寄存器）中。从异常退出的时候，就可以由 SPSR 来恢复 CPSR 。

(3) 根据异常类型，强制设置 CPSR 的运行模式位。

（ 4 ）强制 PC （程序计数器）从相关异常向量地址取出下一条指令执行，从而跳转到相应的异常处理程序中。

至于这些异常类型各代表什么，我也没有深究。因为平常就关心 reset 了，也没有必要弄清楚。

ARM 规定了异常向量的地址：

b reset ；复位 0x0

ldr pc, _undefined_instruction ；未定义的指令异常 0x4

ldr pc, _software_interrupt ；软件中断异常 0x8

ldr pc, _prefetch_abort ；预取指令 0xc

ldr pc, _data_abort ；数据 0x10

ldr pc, _not_used ；未使用 0x14

ldr pc, _irq ；慢速中断异常 0x18

ldr pc, _fiq ；快速中断异常 0x1c

这样理解这段代码就非常简单了。碰到异常时，PC会被强制设置为对应的异常向量，从而跳转到相应的处理程序，然后再返回到主程序继续执行。

这些引导程序的中断向量，是仅供引导程序自己使用的，一旦引导程序引导Linux内核完毕后，会使用自己的中断向量。

嗬嗬，这又有问题了。比如，ARM发生中断(irq)的时候，总是会跑到0x18上执行啊。那Linux内核又怎么能使用自己的中断向量呢？原因在于Linux内核采用页式存储管理。开通MMU的页面映射以后，CPU所发出的地址就是虚拟地址而不是物理地址。就Linux内核而言，虚拟地址0x18经过映射以后的物理地址就是0xc000 0018。所以Linux把中断向量放到0xc000 0018就可以了。

另外，说一下MMU。说句实话，还不是很明白这个MMU机理。参加Intel培训的时候，李眈说了MMU的两个主要作用：

(1 ）安全性：规定访问权限

(2) 提供地址空间：把不连续的空间转换成连续的。

第2点是不是实现页式存储的意思？

2005 年6月9日晚

补充一下： 05/06/14

.globl _start ；系统复位位置
_start: b reset ；各个异常向量对应的跳转代码
ldr pc, _undefined_instruction ；未定义的指令异常

……

_undefined_instruction :
.word undefined_instruction

也许有人会有疑问，同样是跳转指令，为什么第一句用的是 b reset；
而后面的几个都是用ldr？

为了理解这个问题，我们以未定义的指令异常为例。

当发生了这个异常后，CPU总是跳转到0x4，这个地址是虚拟地址，它映射到哪个物理地址
取决于具体的映射。
ldr pc, _undefined_instruction
相对寻址，跳转到标号_undefined_instruction，然而真正的跳转地址其实是_undefined_instruction的内容——undefined_instruction。那句.word的相当于：
_undefined_instruction dw undefined_instruction (详见毕设笔记3）。
这个地址undefined_instruction到底有多远就难说了，也许和标号_undefined_instruction在同一个页面，也许在很远的地方。不过除了reset，其他的异常是MMU开始工作之后才可能发生的，因此undefined_instruction 的地址也经过了MMU的映射。
在刚加电的时候，CPU从0x0开始执行，MMU还没有开始工作，此时的虚拟地址和物理地址相同；另一方面，重启在MMU开始工作后也有可能发生，如果reset也用ldr就有问题了，因为这时候虚拟地址和物理地址完全不同。

因此，之所以reset用b，就是因为reset在MMU建立前后都有可能发生，而其他的异常只有在MMU建立之后才会发生。用b reset，reset子程序与reset向量在同一页面，这样就不会有问题（b是相对跳转的）。如果二者相距太远，那么编译器会报错的。