ARM
汇编指令的一些总结
ARM
汇编指令很多,但是真正常用的不是很多,而且需要认真琢磨的又更少了。
比较有用的是
MOV B BL LDR STR
还是通过具体汇编代码来学习吧。
@ disable watch dog timer
mov r1, #0x53000000 //
立即数寻址方式
mov r2, #0x0
str r2, [r1]
MOV
没有什么好说的,只要掌握几个寻址方式就可以了,而且
ARM
的寻址方式比
386
的简单很多。立即数寻址方式,立即数要求以“
#
”
作前缀,对于十六进制的数,还要求在
#
后面加上
0x
或者
&
。
0x
大家很好理解。有一次我碰到了
&ff
这个数,现在才明白跟
0xff
是一样的。
STR
是比较重要的指令了,跟它对应的是
LDR
。
ARM
指令集是加载
/
存储型的,也就是说它只处理在寄存器中的数据。那么对于系统存储器的访问就经常用到
STR
和
LDR
了。
STR
是把寄存器上的数据传输到指定地址的存储器上。它的格式我个人认为很特殊:
STR(
条件
)
源寄存器,
<
存储器地址
>
比如
STR R0, [R1]
,意思是
R0-> [R1]
,它把源寄存器写在前面,跟
MOV
、
LDR
都相反。
LDR
应该是非常常见了。
LDR
就是把数据从存储器传输到寄存器上。而且有个伪指令也是
LDR
,因此我有个百思不得其解的问题。看这段代码:
mov r1, #GPIO_CTL_BASE
add r1, r1, #oGPIO_F
ldr r2,=0x55aa // 0x55aa
是个立即数啊,前面加个=干什么?
str r2, [r1, #oGPIO_CON]
mov r2, #0xff
str r2, [r1, #oGPIO_UP]
mov r2, #0x00
str r2, [r1, #oGPIO_DAT]
对于当中的
ldr
那句,我就不明白了,如果你把
=
去掉,是不能通过编译的。我查了一些资料,个人感觉知道了原因:这个
=
应该表示
LDR
不是
ARM
指令,而是伪指令。
作为伪指令的时候,
LDR
的格式如下:
LDR
寄存器,
=
数字常量
/Label
它的作用是把一个
32
位的地址或者常量调入寄存器。嗬嗬,那大家可能会问,
“
MOV r2,#0x55aa
”
也可以啊。应该是这样的。不过,
LDR
是伪指令啊,也就是说编译时编译器会处理它的。怎么处理的呢?——规则如下:如果该数字常量在
MOV
指令范围内,汇编器会把这个指令作为
MOV
。如果不在
MOV
范围中,汇编器把该常量放在程序后面,用
LDR
来读取,
PC
和该常量的偏移量不能超过
4KB
。
这么一说,虽然似懂非懂,但是能够解释这个语句了。
然后说一下跳转指令。
ARM
有两种跳转方式。
(
1
)
mov pc <
跳转地址〉
这种向程序计数器
PC
直接写跳转地址,能在
4GB
连续空间内任意跳转。
(
2
)通过
B BL BLX BX
可以完成在当前指令向前或者向后
32MB
的地址空间的跳转(为什么是
32MB
呢?寄存器是
32
位的,此时的值是
24
位有符号数,所以
32MB
)。
B
是最简单的跳转指令。要注意的是,跳转指令的实际值不是绝对地址,而是相对地址——是相对当前
PC
值的一个偏移量,它的值由汇编器计算得出。
BL
非常常用。它在跳转之前会在寄存器
LR(R14)
中保存
PC
的当前内容。
BL
的经典用法如下:
bl NEXT ;
跳转到NEXT
……
NEXT
……
mov pc, lr ;
从子程序返回。
最后提一下
Thumb
指令。
ARM
体系结构还支持
16
位的
Thumb
指令集。
Thumb
指令集是
ARM
指令集的子集,它保留了
32
位代码优势的同时还大大节省了存储空间。由于
Thumb
指令集的长度只有
16
位,所以它的指令比较多。它和
ARM
各有自己的应用场合。对于系统性能有较高要求,应使用
32
位存储系统和
ARM
指令集;对于系统成本和功耗有较高要求,应使用
16
位存储系统和
ARM
指令集。
对ARM异常(Exceptions)的理解
分类:技术笔记
毕设笔记
1
.对
ARM
异常(
Exceptions
)的理解
所有的系统引导程序前面中会有一段类似的代码,如下:
.globl _start
;系统复位位置
_start: b reset
;各个异常向量对应的跳转代码
ldr pc, _undefined_instruction
;未定义的指令异常
ldr pc, _software_interrupt
;软件中断异常
ldr pc, _prefetch_abort
;内存操作异常
ldr pc, _data_abort
;数据异常
ldr pc, _not_used
;未使用
ldr pc, _irq
;慢速中断异常
ldr pc, _fiq
;快速中断异常
|
从中我们可以看出,
ARM
支持
7
种异常。问题时发生了异常后
ARM
是如何响应的呢?第一个复位异常很好理解,它放在
0x0
的位置,一上电就执行它,而且我们的程序总是从复位异常处理程序开始执行的,因此复位异常处理程序不需要返回。那么怎么会执行到后面几个异常处理函数呢?
看看书后,明白了
ARM
对异常的响应过程,于是就能够回答以前的这个疑问。
当一个异常出现以后,
ARM
会自动执行以下几个步骤:
(
1
)把下一条指令的地址放到连接寄存器
LR(
通常是
R14)
,这样就能够在处理异常返回时从正确的位置继续执行。
(
2
)将相应的
CPSR(
当前程序状态寄存器
)
复制到
SPSR
(备份的程序状态寄存器)中。从异常退出的时候,就可以由
SPSR
来恢复
CPSR
。
(3)
根据异常类型,强制设置
CPSR
的运行模式位。
(
4
)强制
PC
(程序计数器)从相关异常向量地址取出下一条指令执行,从而跳转到相应的异常处理程序中。
至于这些异常类型各代表什么,我也没有深究。因为平常就关心
reset
了,也没有必要弄清楚。
ARM
规定了异常向量的地址:
b reset
; 复位 0x0
ldr pc, _undefined_instruction
;未定义的指令异常 0x4
ldr pc, _software_interrupt
;软件中断异常 0x8
ldr pc, _prefetch_abort
;预取指令 0xc
ldr pc, _data_abort
;数据 0x10
ldr pc, _not_used
;未使用 0x14
ldr pc, _irq
;慢速中断异常 0x18
ldr pc, _fiq
;快速中断异常 0x1c
这样理解这段代码就非常简单了。碰到异常时,PC会被强制设置为对应的异常向量,从而跳转到相应的处理程序,然后再返回到主程序继续执行。
这些引导程序的中断向量,是仅供引导程序自己使用的,一旦引导程序引导Linux内核完毕后,会使用自己的中断向量。
嗬嗬,这又有问题了。比如,ARM发生中断(irq)的时候,总是会跑到0x18上执行啊。那Linux内核又怎么能使用自己的中断向量呢?原因在于Linux内核采用页式存储管理。开通MMU的页面映射以后,CPU所发出的地址就是虚拟地址而不是物理地址。就Linux内核而言,虚拟地址0x18经过映射以后的物理地址就是0xc000 0018。所以Linux把中断向量放到0xc000 0018就可以了。
另外,说一下MMU。说句实话,还不是很明白这个MMU机理。参加Intel培训的时候,李眈说了MMU的两个主要作用:
(1
)安全性:规定访问权限
(2)
提供地址空间:把不连续的空间转换成连续的。
第2点是不是实现页式存储的意思?
2005
年6月9日
晚
补充一下: 05/06/14
.globl _start ;系统复位位置
_start: b reset ;各个异常向量对应的跳转代码
ldr pc, _undefined_instruction ;未定义的指令异常
……
_undefined_instruction :
.word undefined_instruction
也许有人会有疑问,同样是跳转指令,为什么第一句用的是 b reset;
而后面的几个都是用ldr?
为了理解这个问题,我们以未定义的指令异常为例。
当发生了这个异常后,CPU总是跳转到0x4,这个地址是虚拟地址,它映射到哪个物理地址
取决于具体的映射。
ldr pc, _undefined_instruction
相对寻址,跳转到标号_undefined_instruction,然而真正的跳转地址其实是_undefined_instruction的内容——undefined_instruction。那句.word的相当于:
_undefined_instruction dw undefined_instruction (详见毕设笔记3)。
这个地址undefined_instruction到底有多远就难说了,也许和标号_undefined_instruction在同一个页面,也许在很远的地方。不过除了reset,其他的异常是MMU开始工作之后才可能发生的,因此undefined_instruction 的地址也经过了MMU的映射。
在刚加电的时候,CPU从0x0开始执行,MMU还没有开始工作,此时的虚拟地址和物理地址相同;另一方面,重启在MMU开始工作后也有可能发生,如果reset也用ldr就有问题了,因为这时候虚拟地址和物理地址完全不同。
因此,之所以reset用b,就是因为reset在MMU建立前后都有可能发生,而其他的异常只有在MMU建立之后才会发生。用b reset,reset子程序与reset向量在同一页面,这样就不会有问题(b是相对跳转的)。如果二者相距太远,那么编译器会报错的。
.globl _start ;系统复位位置
_start: b reset ;各个异常向量对应的跳转代码
ldr pc, _undefined_instruction ;未定义的指令异常
……
_undefined_instruction :
.word undefined_instruction
也许有人会有疑问,同样是跳转指令,为什么第一句用的是 b reset;
而后面的几个都是用ldr?
为了理解这个问题,我们以未定义的指令异常为例。
当发生了这个异常后,CPU总是跳转到0x4,这个地址是虚拟地址,它映射到哪个物理地址
取决于具体的映射。
ldr pc, _undefined_instruction
相对寻址,跳转到标号_undefined_instruction,然而真正的跳转地址其实是_undefined_instruction的内容——undefined_instruction。那句.word的相当于:
_undefined_instruction dw undefined_instruction (详见毕设笔记3)。
这个地址undefined_instruction到底有多远就难说了,也许和标号_undefined_instruction在同一个页面,也许在很远的地方。不过除了reset,其他的异常是MMU开始工作之后才可能发生的,因此undefined_instruction 的地址也经过了MMU的映射。
在刚加电的时候,CPU从0x0开始执行,MMU还没有开始工作,此时的虚拟地址和物理地址相同;另一方面,重启在MMU开始工作后也有可能发生,如果reset也用ldr就有问题了,因为这时候虚拟地址和物理地址完全不同。
因此,之所以reset用b,就是因为reset在MMU建立前后都有可能发生,而其他的异常只有在MMU建立之后才会发生。用b reset,reset子程序与reset向量在同一页面,这样就不会有问题(b是相对跳转的)。如果二者相距太远,那么编译器会报错的。