arm 指令学习载录

最新推荐文章于 2024-05-01 09:37:21 发布

cosmoslhf

最新推荐文章于 2024-05-01 09:37:21 发布

阅读量2.7w

点赞数 6

分类专栏：汇编

本文链接：https://blog.csdn.net/cosmoslhf/article/details/38140397

版权

汇编专栏收录该内容

7 篇文章 0 订阅

订阅专栏

ARM处理器汇编

ARM寻址方式：

1、立即寻址，操作数在指令中给出。

ADDR0,R0,#1; R0ßR0+1

ANDR8,R7,#&FF; R8ßR7[7:0];

ADDR0,R0,#&3F R0ßR0+0X3F

立即数要求加上#作为前缀，十六进制使用0x，或者&表示

2、寄存器寻址，直接使用寄存器名字

ADD R0,R1,R2; R0ßR1+R2

3、寄存器移位寻址，ARM特有

ADD R3,R2,R1,LSL#3; R3ßR2+8*R1

其中LSL #3 为左移三位

表示移位的还有：

LSL：逻辑左移

LSR：逻辑右移

ASR：算术右移

ROR：循环右移

RRX：扩展为1的循环右移

4、寄存器间接寻址，寄存器中的值作为操作数地址,操作数在RAM中

LDR R0,[R1]; R0ß[R1]

STR R0,[R1]; [R1]ßR0

5、基址寻址，给定寄存器的值加上一个偏移作为操作数地址，操作数在RAM中

LDR R0,[R1,#4]; R0ß[R1+4]

LDR R0,[R1,#4]!; R0ß[R1+4],R1ßR1+4

LDR R0,[R1],#4; R0ß[R1],R1ßR1+4

LDR R0,[R1,R2]; R0ß[R1+R2]

6、多寄存器寻址，一条指令可以完成多个寄存器值的传送，最多16个寄存器

LDMIAR0,{R1,R2,R3,R4}; R1ß[R0],R2ß[R0+4],R3ß[R0+8],R4ß[R0+12]

格式：LDM+

IB：地址增加在先

R1ß[R0+4],R2ß[R0+8],R3ß[R0+12],R4ß[R0+16]

IA：地址增加在后

R1ß[R0],R2ß[R0+4],R3ß[R0+8],R4ß[R0+12]

DB：地址减少在先

R1ß[R0-4],R2ß[R0-8],R3ß[R0-12],R4ß[R0-16]

DA：地址减少在后

R1ß[R0],R2ß[R0-4],R3ß[R0-8],R4ß[R0-12]

I：Increment

D：Decrement

B：Before

A：After

7、堆栈寻址

堆栈寻址有四种情况

1，堆栈向高地址方向生长

2，堆栈向低地址方向生长

3，当前堆栈指针指向有意义的数据[满]（推送数据前堆栈需腾出4字节空间）

4，当前堆栈指针指向无意义的数据（可直接向当前位置推送数据）

1,2情况与3,4情况两两组合，产生四种结果，四种结果如下

满递增堆栈（FA）：

堆栈指针指向最后压入的数据，且由低地址向高地址生成。

入栈：STMFA，出栈：LDMFA

满递减堆栈（FD）：

堆栈指针指向最后压入的数据，且由高地址向低地址生成。

入栈：STMFD，出栈：LDMFD

空递增堆栈（EA）：

堆栈指针指向下一个将要放入数据的空位置，且由低地址向高地址生成。

入栈：STMEA，出栈：LDMEA

空递减堆栈（ED）：

堆栈指针指向下一个将要放入数据的空位置，且由高地址向低地址生成。

入栈：STMED，出栈：LDMED

STMFA r13!, {r0-r5} ; Push onto a FullAscending Stack

LDMFA r13!, {r0-r5} ; Pop from a FullAscending Stack

STMFD r13!, {r0-r5} ; Push onto a FullDescending Stack

LDMFD r13!, {r0-r5} ; Pop from a Full DescendingStack

STMEA r13!, {r0-r5} ; Push onto an EmptyAscending Stack

LDMEA r13!, {r0-r5} ; Pop from an EmptyAscending Stack

STMED r13!, {r0-r5} ; Push onto EmptyDescending Stack

LDMED r13!, {r0-r5} ; Pop from an EmptyDescending Stack

SP＝0x0FF8

出栈

入栈

SP＝0x1000

8、相对寻址

以程序计数器PC的当前值为基地址，指令中的地址标号作为偏移量，将两者相加之后得到操作数的有效地址。

LDRPC,[PC,#+0xFF0]；PC ←[PC+8+0xFF0]

ARM微处理器指令分类

1、跳转指令

2、数据处理指令

3、程序状态寄存器（PSR）传输指令

4、加载、存储（Load/Store）指令

5、协处理器指令

6、异常中断产生指令

ARM微处理器指令格式

典型的ARM指令格式（机器码）如下：

语法格式：

<opcode>:指令助记符

{<cond>}:指令执行条件

{<S>} :指令的操作是否影响CPSR的值

<Rd> :目标寄存器

<Rn> :包含第一个操作数的寄存器

<shifter_operand>:第二个操作数

指令的条件域

当处理器工作在ARM状态时，几乎所有的指令均可根据CPSR中条件码的状态和指令的条件域有条件的执行。当指令的执行满足条件时被执行。

每一条ARM指令包含4位条件码，位于指令的最高4位[31:28]。条件码共有16种，每种条件码可用两个字符表示，这两个字符可以添加在指令助记符的后面和指令同时使用。

B 无条件跳转

BEQ 相等则跳转，即当CPSR中的Z标志置位时发生跳转。

条件码	助记符后缀	标志	含义
0000	EQ	Z置位	相等
0001	NE	Z清零	不相等
0010	CS/HS	C置位	无符号数大于或等于
0011	CC/LO	C清零	无符号数小于
0100	MI	N置位	负数
0101	PL	N清零	正数或零
0110	VS	V置位	溢出
0111	VC	V清零	未溢出
1000	HI	C置位Z清零	无符号数大于
1001	LS	C清零Z置位	无符号数小于或等于
1010	GE	N等于V	带符号数大于或等于
1011	LT	N不等于V	带符号数小于
1100	GT	Z清零且（N等于V）	带符号数大于
1101	LE	Z置位或（N不等于V）	带符号数小于或等于
1110	AL	忽略	无条件执行

几乎所有的ARM数据处理指令均可以根据执行结果来选择是否更新条件码标志。若要更新条件码标志，则指令中须包含后缀S

一些指令（CMP，CMN，TST，TEQ）不需要后缀S

一些指令只更新部分标志，而不影响其他标志

跳转指令

在ARM程序中有两种方法可以实现程序的跳转

1、使用跳转指令

2、直接向程序计数器PC写入目标地址值

通过向PC寄存器写入跳转地址值，可以实现在4G的地址空间中任意跳转。这种跳转指令称为长跳转。

ARM的跳转指令可以从当前指令向前或者向后的32M的地址空间跳转，包括以下四条指令：

B 跳转指令

BL 带返回的跳转指令

BLX 带返回和状态切换的跳转指令

BX 带状态切换的跳转指令

Cond(31:28)

1 0 1

L(24)

Signed_immed_24(23:0)

指令的语法格式

B{L}{<cond>}<targt_address>

L:是否保存返回地址（ L：PCàLR )

<cond>:指令执行的条件码

<targt_address>：指令跳转的目标地址。计算方法，24 位有符号数补码立即数扩展为 32 位，再左移2位；将得到的值加到PC寄存器中，即得到跳转的目标地址。(-32MB~+32MB)。

B（跳转指令）及BL（带返回的跳转指令）

指令的使用

子程序返回：

BX R14

MOV PC，R14

STMFDR13!,{<registers>,R14}

LDMFDR13!,{<registers>,PC}

示例

B Label ;程序跳转到标号Label处执行

BCS Label ;当CPSR寄存器中的C条件码置位时，程序 ;跳转到标号Label处执行

BL func_1 ;程序跳转到子程序func_1处执行，同时将当前PC值 ;保存到LR中

BLX(1)

BLX(1)指令从ARM指令集跳转到指令中所指定的目标地址，并将处理器的工作状态切换到Thumb状态，该指令同时将PC寄存器的内容复制到LR寄存器中。

本指令属于无条件执行的指令

指令的语法格式

BLX <targt_address>

BLX(2)

BLX(2)指令从ARM指令集跳转到指令中所指定的目标地址，目标地址的指令可以是ARM指令，也可以是Thumb指令。目标地址放在指令中的寄存器<Rm>中，当<Rm>寄存器的bit[0]值为0时，目标地址处的指令类型为ARM指令；当<Rm>寄存器的bit[0]值为1时，目标地址处的指令类型为Thumb指令。该指令同时将PC寄存器的内容复制到LR寄存器中。

指令的语法格式

BLX{<cond>} <Rm>

BLX(2)

BLX 目标地址

BLX指令从ARM指令集跳转到指令中所指定的目标地址，并将处理器的工作状态从ARM状态切换到Thumb状态，该指令同时将PC的当前内容保存到寄存器R14中。因此，当子程序使用Thumb指令集，而调用者使用ARM指令集时，可以通过BLX指令实现子程序的调用和处理器工作状态的切换。同时，子程序的返回可以通过将寄存器R14值复制到PC中来完成。

BX指令

BX{条件} 目标地址

BX指令跳转到指令中所指定的目标地址，目标地址处的指令既可以是ARM指令，也可以是Thumb指令。

数据处理指令：

数据处理指令可分为数据传送指令、算术逻辑运算指令和比较指令等。

数据传送指令用于在寄存器之间进行数据的传输。

算术逻辑运算指令完成常用的算术逻辑运算，该类指令不但将运算结果保存在目的寄存器中，同时更新CPSR中的相应条件标志位。

比较指令不保存运算结果，只更新CPSR中相应的条件标志位。

ARM指令集中数据处理指令集包括：

传送指令：

MOV 数据传送指令

MVN 数据取反传送指令

比较指令：

CMP 比较指令

CMN 反值比较指令

TST 位测试指令

TEQ 相等测试指令

算术指令：

ADD 加法指令

ADC 带进位加法指令

SUB 减法指令

SBC 带借位减法指令

RSB 逆向减法指令

RSC 带借位的逆向减法指令

逻辑指令：

AND 逻辑与指令

ORR 逻辑或指令

EOR 逻辑异或指令

BIC 位清除指令

MOV指令

MOV{条件}{S} 目的寄存器，源操作数

MOV指令可完成从另一个寄存器、被移位的寄存器或将一个立即数加载到目的寄存器。其中S选项决定指令的操作是否影响CPSR中条件标志位的值，当没有S时指令不更新CPSR中条件标志位的值。

MOV R1，R0 ；将寄存器R0的值传送到寄存器R1

MOV PC，R14

；将寄存器R14的值传送到PC，常用于子程序返回

MOV R1，R0，LSL #3

；将寄存器R0的值左移3位后传送到R1

MVN指令

MVN{条件}{S} 目的寄存器，源操作数

MVN指令可完成从另一个寄存器、被移位的寄存器、或将一个立即数加载到目的寄存器。与MOV指令不同之处是在传送之前按位被取反了，即把一个被取反的值传送到目的寄存器中。其中S决定指令的操作是否影响CPSR中条件标志位的值，当没有S时指令不更新CPSR中条件标志位的值。

MVN R0，＃0

；将立即数0取反传送到寄存器R0中，完成后R0=-1

CMP指令

CMP{条件} 操作数1，操作数2

CMP指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行比较，同时更新CPSR中条件标志位的值。该指令进行一次减法运算，但不存储结果，只更改条件标志位。标志位表示的是操作数1与操作数2的关系(大、小、相等)。

CMP R1，R0

；将寄存器R1的值与寄存器R0的值相减，并根据结果设置CPSR的标志位

CMP R1，＃100

；将寄存器R1的值与立即数100相减，并根据结果设置CPSR的标志位

CMN指令

CMN{条件} 操作数1，操作数2

CMN指令用于把一个寄存器的内容和另一个寄存器的内容或立即数取反后进行比较，同时更新CPSR中条件标志位的值。该指令实际完成操作数1和操作数2相加，并根据结果更改条件标志位。

CMN R1，R0

；将寄存器R1的值与寄存器R0的值相加，并根据结果设置CPSR的标志位

CMN R1，＃100

；将寄存器R1的值与立即数100相加，并根据结果设置CPSR的标志位

TST指令

TST{条件} 操作数1，操作数2

TST指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的与运算，并根据运算结果更新CPSR中条件标志位的值。操作数1是要测试的数据，而操作数2是一个位掩码，该指令一般用来检测是否设置了特定的位。

TST R1, #2_1

；用于测试在寄存器R1中是否设置了最低位

TST R1, #0xff0

；将寄存器R1的值与立即数0xff0按位与，并根据结果设置CPSR的标志位

TEQ指令

TEQ{条件} 操作数1，操作数2

TEQ指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的异或运算，并根据运算结果更新CPSR中条件标志位的值。该指令通常用于比较操作数1和操作数2是否相等。

TEQ R1，R2

；将寄存器R1的值与寄存器R2的值按位异或，并根据结果设置CPSR的标志位。

ADD指令

ADD{条件}{S} 目的寄存器，操作数1，操作数2

ADD指令用于把两个操作数相加，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。

ADD R0，R1，R2 ； R0 = R1 + R2

ADD R0，R1，#256 ； R0 = R1 + 256

ADD R0，R2，R3，LSL#1

； R0 = R2 + (R3 << 1)

； R0 = R2 + 2×R3

ADC指令

ADC{条件}{S} 目的寄存器，操作数1，操作数2

ADC指令用于把两个操作数相加，再加上CPSR中的C条件标志位的值，并将结果存放到目的寄存器中。它使用一个进位标志位，这样就可以做比32位大的数的加法。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。

两个128位数的加法：

ADDS R0，R4，R8 ；加低端的字，带进位 ADCS R1，R5，R9 ；加第二个字，带进位

ADCS R2，R6，R10 ；加第三个字，带进位

ADC R3，R7，R11 ；加第四个字

SUB指令

SUB{条件}{S} 目的寄存器，操作数1，操作数2

SUB指令用于把操作数1减去操作数2，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令可用于有符号数或无符号数的减法运算。

SUB R0，R1，R2 ； R0 = R1 - R2

SUB R0，R1，#256 ； R0 = R1 - 256

SUB R0，R2，R3，LSL #1

； R0 = R2 - (R3 << 1)

SBC指令

SBC{条件}{S} 目的寄存器，操作数1，操作数2

SBC指令用于把操作数1减去操作数2，再减去CPSR中的C条件标志位的反码，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令使用进位标志来表示借位，这样就可以做大于32位的减法。该指令可用于有符号数或无符号数的减法运算。

SBCS R0，R1，R2

；R0 = R1 - R2 - ！C，并根据结果设置CPSR的进位标志位

RSB指令

RSB指令的格式为：

RSB{条件}{S} 目的寄存器，操作数1，操作数2

RSB指令称为逆向减法指令，用于把操作数2减去操作数1，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令可用于有符号数或无符号数的减法运算。

RSB R0，R1，R2 ；R0 = R2 – R1

RSB R0，R1，#256 ；R0 = 256 – R1

RSB R0，R2，R3，LSL#1

； R0 = (R3 << 1) - R2

RSC指令

RSC指令的格式为：

RSC{条件}{S} 目的寄存器，操作数1，操作数2

RSC指令用于把操作数2减去操作数1，再减去CPSR中的C条件标志位的反码，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令使用进位标志来表示借位，这样就可以做大于32位的减法。该指令可用于有符号数或无符号数的减法运算。

RSC R0，R1，R2 ；R0 = R2 – R1 - ！C

AND指令

AND指令的格式为：

AND{条件}{S} 目的寄存器，操作数1，操作数2

AND指令用于在两个操作数上进行逻辑与运算，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令常用于屏蔽操作数1的某些位。

AND R0，R0，＃3

；该指令保持R0的0、1位，其余位清零。

ORR指令

ORR指令的格式为：

ORR{条件}{S} 目的寄存器，操作数1，操作数2

ORR指令用于在两个操作数上进行逻辑或运算，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令常用于设置操作数1的某些位。

ORR R0，R0，＃3

；该指令设置R0的0、1位，其余位保持不变。

EOR指令

EOR指令的格式为：

EOR{条件}{S} 目的寄存器，操作数1，操作数2

EOR指令用于在两个操作数上进行逻辑异或运算，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令常用于反转操作数1的某些位。

EOR R0，R0，＃3

；该指令反转R0的0、1位，其余位保持不变。

乘法指令与乘加指令

ARM微处理器支持的乘法指令与乘加指令共有6条，可分为运算结果为32位和运算结果为64位两类，与前面的数据处理指令不同，指令中的所有操作数、目的寄存器必须为通用寄存器，不能对操作数使用立即数或被移位的寄存器，同时，目的寄存器和操作数1必须是不同的寄存器。

乘法指令与乘加指令共有以下6条：

MUL 32位乘法指令

MLA 32位乘加指令

SMULL 64位有符号数乘法指令

SMLAL 64位有符号数乘加指令

UMULL 64位无符号数乘法指令

UMLAL 64位无符号数乘加指令

MUL指令

MUL指令的格式为：

MUL{条件}{S} 目的寄存器，操作数1，操作数2

MUL指令完成将操作数1与操作数2的乘法运算，并把结果（低32位）放置到目的寄存器中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的有符号数或无符号数。

MUL R0，R1，R2

；R0 = R1 × R2低32位

;R1=0x00FFFFFF,R2=0x00123456,R0=0x55EDCBAA

;0x00FFFFFF*0x00123456=0x123455EDCBAA

SMULL指令

SMULL指令的格式为：

SMULL{条件}{S} 目的寄存器Low，目的寄存器High，操作数1，操作数2

SMULL指令完成操作数1与操作数2的乘法运算，并把结果的低32位放置到目的寄存器Low中，结果的高32位放置到目的寄存器High中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的有符号数。

SMULL R0，R1，R2，R3

； R0 = （R2 × R3）的低32位；R1 = （R2 × R3）的高32位

;R2=0x00FFFFFF,R3=0x00123456

; R0=0x55EDCBAA,R1=0x00001234

;0x00FFFFFF*0x00123456=123455EDCBAA

SMLAL指令

SMLAL指令的格式为：

SMLAL{条件}{S} 目的寄存器Low，目的寄存器High，操作数1，操作数2

SMLAL指令完成操作数1与操作数2的乘法运算，并把结果的低32位同目的寄存器Low中的值相加后又放置到目的寄存器Low中，结果的高32位同目的寄存器High中的值相加后又放置到目的寄存器High中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的有符号数。

对于目的寄存器Low，在指令执行前存放64位加数的低32位，指令执行后存放结果的低32位。

对于目的寄存器High，在指令执行前存放64位加数的高32位，指令执行后存放结果的高32位。

SMLAL R0，R1，R2，R3

；R0 = （R2 × R3）的低32位＋ R0 ；R1 = （R2 × R3）的高32位＋ R1

UMULL指令

UMULL指令的格式为：

UMULL{条件}{S} 目的寄存器Low，目的寄存器High，操作数1，操作数2

UMULL指令完成操作数1与操作数2的乘法运算，并把结果的低32位放置到目的寄存器Low中，结果的高32位放置到目的寄存器High中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的无符号数。

UMULL R0，R1，R2，R3

；R0 = （R2 × R3）的低32位

；R1 = （R2 × R3）的高32位

UMLAL指令

UMLAL指令的格式为：

UMLAL{条件}{S} 目的寄存器Low，目的寄存器High，操作数1，操作数2

UMLAL指令完成操作数1与操作数2的乘法运算，并把结果的低32位同目的寄存器Low中的值相加后又放置到目的寄存器Low中，结果的高32位同目的寄存器High中的值相加后又放置到目的寄存器High中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的无符号数。

对于目的寄存器Low，在指令执行前存放64位加数的低32位，指令执行后存放结果的低32位。

对于目的寄存器High，在指令执行前存放64位加数的高32位，指令执行后存放结果的高32位。

UMLAL R0，R1，R2，R3

；R0 = （R2 × R3）的低32位＋ R0

；R1 = （R2 × R3）的高32位＋ R1

程序状态寄存器访问指令

ARM微处理器支持程序状态寄存器访问指令，用于在程序状态寄存器和通用寄存器之间传送数据，程序状态寄存器访问指令包括以下两条：

MRS 程序状态寄存器到通用寄存器的数据传送指令

MSR 通用寄存器到程序状态寄存器的数据传送指令

MRS指令

MRS指令的格式为：

MRS{条件} 通用寄存器，程序状态寄存器（CPSR或SPSR）

MRS指令用于将程序状态寄存器的内容传送到通用寄存器中。该指令一般用在以下几种情况：

当需要改变程序状态寄存器的内容时，可用MRS将程序状态寄存器的内容读入通用寄存器，修改后再写回程序状态寄存器。

当在异常处理或进程切换时，需要保存程序状态寄存器的值，可先用该指令读出程序状态寄存器的值，然后保存。

MRS R0，CPSR ；传送CPSR的内容到R0

MRS R0，SPSR ；传送SPSR的内容到R0

MSR指令

MSR指令的格式为：

MSR{条件} 程序状态寄存器（CPSR或SPSR）_<域>，操作数

MSR指令用于将操作数的内容传送到程序状态寄存器的特定域中。其中，操作数可以为通用寄存器或立即数。<域>用于设置程序状态寄存器中需要操作的位，32位的程序状态寄存器可分为4个域：

位[31：24]为条件标志位域，用f表示；

位[23：16]为状态位域，用s表示；

位[15：8]为扩展位域，用x表示；

位[7：0]为控制位域，用c表示；

该指令通常用于恢复或改变程序状态寄存器的内容，在使用时，一般要在MSR指令中指明将要操作的域。

MSR CPSR_cxsf，R0 ；传送R0的内容到CPSR

MSR SPSR_cxsf，R0 ；传送R0的内容到SPSR

MSR CPSR_c，R0

；传送R0的内容到SPSR，但仅仅修改CPSR中的控制位域

加载/存储指令

ARM微处理器支持加载/存储指令用于在寄存器和存储器之间传送数据，加载指令用于将存储器中的数据传送到寄存器，存储指令则完成相反的操作。常用的加载存储指令如下：

LDR 字数据加载指令

LDRB 字节数据加载指令

LDRH 半字数据加载指令

STR 字数据存储指令

STRB 字节数据存储指令

STRH 半字数据存储指令

LDR指令

LDR指令的格式为：

LDR{条件} 目的寄存器，<存储器地址>

LDR指令用于从存储器中将一个32位的字数据传送到目的寄存器中。该指令通常用于从存储器中读取32位的字数据到通用寄存器，然后对数据进行处理。当程序计数器PC作为目的寄存器时，指令从存储器中读取的字数据被当作目的地址，从而可以实现程序流程的跳转。该指令在程序设计中比较常用，且寻址方式灵活多样。

LDR R0，[R1] ；将存储器地址为R1的字数据读入寄存器R0

LDR R0，[R1，R2] ；将存储器地址为R1+R2的字数据读入寄存器R0

LDR R0，[R1，＃8] ；将存储器地址为R1+8的字数据读入寄存器R0

LDR R0，[R1，R2]！

；将存储器地址为R1+R2的字数据读入寄存器R0，并将新地址R1＋R2写入R1

LDR R0，[R1，＃8]！

；将存储器地址为R1+8的字数据读入寄存器R0，并将新地址R1＋8写入R1

LDR R0，[R1]，R2

；将存储器地址为R1的字数据读入寄存器R0，并将新地址R1＋R2写入R1

LDR R0，[R1，R2，LSL＃2]！

；将存储器地址为R1＋R2×4的字数据读入寄存器R0，并将新地址R1＋R2×4写入R1

LDR R0，[R1]，R2，LSL＃2

；将存储器地址为R1的字数据读入寄存器R0，并将新地址R1＋R2×4写入R1

LDRB指令

LDRB指令的格式为：

LDR{条件}B 目的寄存器，<存储器地址>

LDRB指令用于从存储器中将一个8位的字节数据传送到目的寄存器中，同时将寄存器的高24位清零。该指令通常用于从存储器中读取8位的字节数据到通用寄存器，然后对数据进行处理。

LDRB R0，[R1]

；将存储器地址为R1的字节数据读入寄存器R0，并将R0的高24位清零

LDRB R0，[R1，＃8]

；将存储器地址为R1＋8的字节数据读入寄存器R0，并将R0的高24位清零

LDRH指令

LDRH指令的格式为：

LDR{条件}H 目的寄存器，<存储器地址>

LDRH指令用于从存储器中将一个16位的半字数据传送到目的寄存器中，同时将寄存器的高16位清零。该指令通常用于从存储器中读取16位的半字数据到通用寄存器，然后对数据进行处理。

LDRH R0，[R1]

；将存储器地址为R1的半字数据读入寄存器R0，并将R0的高16位清零

LDRH R0，[R1，＃8]

；将存储器地址为R1＋8的半字数据读入寄存器R0，并将R0的高16位清零

LDRH R0，[R1，R2]

；将存储器地址为R1＋R2的半字数据读入寄存器R0，并将R0的高16位清零

STR指令

STR指令的格式为：

STR{条件} 源寄存器，<存储器地址>

STR指令用于从源寄存器中将一个32位的字数据传送到存储器中。该指令在程序设计中比较常用，且寻址方式灵活多样，使用方式可参考指令LDR。

STR R0，[R1]，＃8

；将R0中的字数据写入以R1为地址的存储器中，并将新地址R1＋8写入R1

STR R0，[R1，＃8]

；将R0中的字数据写入以R1＋8为地址的存储器中

STRB指令

STRB指令的格式为：

STR{条件}B 源寄存器，<存储器地址>

STRB指令用于从源寄存器中将一个8位的字节数据传送到存储器中。该字节数据为源寄存器中的低8位。

STRB R0，[R1]

；将寄存器R0中的字节数据写入以R1为地址的存储器中

STRB R0，[R1，＃8]

；将寄存器R0中的字节数据写入以R1＋8为地址的存储器中

STRH指令

STRH指令的格式为：

STR{条件}H 源寄存器，<存储器地址>

STRH指令用于从源寄存器中将一个16位的半字数据传送到存储器中。该半字数据为源寄存器中的低16位。

STRH R0，[R1]

；将寄存器R0中的半字数据写入以R1为地址的存储器中

STRH R0，[R1，＃8]

；将寄存器R0中的半字数据写入以R1＋8为地址的存储器中

批量数据加载/存储指令

ARM微处理器所支持批量数据加载/存储指令可以一次在一片连续的存储器单元和多个寄存器之间传送数据，批量加载指令用于将一片连续的存储器中的数据传送到多个寄存器，批量数据存储指令则完成相反的操作。

常用的加载存储指令如下：

LDM 批量数据加载指令

STM 批量数据存储指令

LDM（或STM）指令

LDM（或STM）指令的格式为：

LDM（或STM）{条件}{类型} 基址寄存器{！}，寄存器列表{∧}

LDM（或STM）指令用于从由基址寄存器所指示的一片连续存储器到寄存器列表所指示的多个寄存器之间传送数据，该指令的常见用途是将多个寄存器的内容入栈或出栈。其中，{类型}为以下几种情况：

IA 每次传送后地址加1；

IB 每次传送前地址加1；

DA每次传送后地址减1；

DB 每次传送前地址减1；

FD 满递减堆栈；

ED 空递减堆栈；

FA 满递增堆栈；

EA 空递增堆栈；

{！}为可选后缀，若选用该后缀，则当数据传送完毕之后，将最后的地址写入基址寄存器，否则基址寄存器的内容不改变。

基址寄存器不允许为R15，寄存器列表可以为R0～R15的任意组合。

{∧}为可选后缀，当指令为LDM且寄存器列表中包含R15，选用该后缀时表示：除了正常的数据传送之外，还将SPSR复制到CPSR。

从子程序返回：

无嵌套

MOV PC,LR

有嵌套

STMFD R13!，{R0，R4-R12，LR}

；将寄存器列表中的寄存器（R0，R4到R12，LR）存入堆栈

……

LDMFD R13!，{R0，R4-R12，PC}

；将堆栈内容恢复到寄存器（R0，R4到R12，LR）

从异常返回（例如IRQ中断）：

无嵌套

SUBS PC,LR,#4

其他

SUBS LR，LR，＃4

STMFD R13!，{R0，R4-R12，LR}

；将寄存器列表中的寄存器（R0，R4到R12，LR）存入堆栈

LDMFD R13!，{R0，R4-R12，PC}^

；将堆栈内容恢复到寄存器（R0，R4到R12，LR）

数据交换指令(信号量操作指令）

ARM微处理器所支持数据交换指令能在存储器和寄存器之间交换数据。数据交换指令有如下两条：

SWP 字数据交换指令

SWPB 字节数据交换指令

SWP指令

SWP指令的格式为：

SWP{条件} 目的寄存器，源寄存器1，[源寄存器2]

SWP指令用于将源寄存器2所指向的存储器中的字数据传送到目的寄存器中，同时将源寄存器1中的字数据传送到源寄存器2所指向的存储器中。当源寄存器1和目的寄存器为同一个寄存器时，指令交换该寄存器和存储器的内容。

SWP R0，R1，[R2]

；将R2所指向的存储器中的字数据传送到R0，同时将R1中的字数据传送到R2所指向的存储单元

SWP R0，R0，[R1]

；该指令完成将R1所指向的存储器中的字数据与R0中的字数据交换

SWPB指令

SWPB指令的格式为：

SWP{条件}B 目的寄存器，源寄存器1，[源寄存器2]

SWPB指令用于将源寄存器2所指向的存储器中的字节数据传送到目的寄存器中，目的寄存器的高24清零，同时将源寄存器1中的字节数据传送到源寄存器2所指向的存储器中。显然，当源寄存器1和目的寄存器为同一个寄存器时，指令交换该寄存器和存储器的内容。

SWPB R0，R1，[R2]

；将R2所指向的存储器中的字节数据传送到R0，R0的高24位清零，同时将R1中的低8位数据传送到R2所指向的存储单元

SWPB R0，R0，[R1]

；该指令完成将R1所指向的存储器中的字节数据与R0中的低8位数据交换, R0的高24位清零

移位操作

ARM微处理器内嵌的桶型移位器（Barrel Shifter），支持数据的各种移位操作，移位操作在ARM指令集中不作为单独的指令使用，它只能作为指令格式中是一个字段，在汇编语言中表示为指令中的选项。例如，数据处理指令的第二个操作数为寄存器时，就可以加入移位操作选项对它进行各种移位操作。移位操作包括如下6种类型：

LSL 逻辑左移

ASL 算术左移

LSR 逻辑右移

ASR 算术右移

ROR 循环右移

RRX 带扩展的循环右移

LSL（或ASL）操作

LSL（或ASL）操作的格式为：

通用寄存器，LSL（或ASL）操作数

LSL（或ASL）可完成对通用寄存器中的内容进行逻辑（或算术）的左移操作，按操作数所指定的数量向左移位，低位用零来填充。其中，操作数可以是通用寄存器，也可以是立即数（1～31）。

MOV R0, R1, LSL #2

；将R1中的内容左移两位后传送到R0中。

LSR操作

LSR操作的格式为：

通用寄存器，LSR 操作数

LSR可完成对通用寄存器中的内容进行右移的操作，按操作数所指定的数量向右移位，左端用零来填充。其中，操作数可以是通用寄存器，也可以是立即数（1～32）。

MOV R0, R1, LSR #2

；将R1中的内容右移两位后传送到R0中，左端用零来填充。

ASR操作

ASR操作的格式为：

通用寄存器，ASR 操作数

ASR可完成对通用寄存器中的内容进行右移的操作，按操作数所指定的数量向右移位，左端用第31位的值来填充。其中，操作数可以是通用寄存器，也可以是立即数（1～32）。

MOV R0, R1, ASR #2

；将R1中的内容右移两位后传送到R0中，左端用第31位的值来填充。

ROR操作

ROR操作的格式为：

通用寄存器，ROR 操作数

ROR可完成对通用寄存器中的内容进行循环右移的操作，按操作数所指定的数量向右循环移位，左端用右端移出的位来填充。其中，操作数可以是通用寄存器，也可以是立即数（1～31）。

MOV R0, R1, ROR #2

；将R1中的内容循环右移两位后传送到R0中。

RRX操作

RRX操作的格式为：

通用寄存器，RRX

RRX可完成对通用寄存器中的内容进行带扩展的循环右移的操作，按操作数所指定的数量向右循环移位，左端用进位标志位C来填充。

MOV R0, R1, RRX

；将R1中的内容进行带扩展的循环右移一位后传送到R0中。

协处理器指令

ARM微处理器可支持多达16个协处理器，用于各种协处理操作，在程序执行的过程中，每个协处理器只执行针对自身的协处理指令，忽略ARM处理器和其他协处理器的指令。

ARM的协处理器指令主要用于ARM处理器初始化ARM协处理器的数据处理操作，以及在ARM处理器的寄存器和协处理器的寄存器之间传送数据，和在ARM协处理器的寄存器和存储器之间传送数据。ARM协处理器指令包括以下5条：

CDP 协处理器数据操作指令

LDC 协处理器数据加载指令

STC 协处理器数据存储指令

MCR ARM处理器寄存器到协处理器寄存器的数据传送指令

MRC 协处理器寄存器到ARM处理器寄存器的数据传送指令

CDP指令

CDP指令的格式为：

CDP{条件} 协处理器编码，协处理器操作码1，目的寄存器，源寄存器1，源寄存器协处理器操作码2

CDP指令用于ARM处理器通知ARM协处理器执行特定的操作,若协处理器不能成功完成特定的操作，则产生未定义指令异常。其中协处理器操作码1和协处理器操作码2为协处理器将要执行的操作，目的寄存器和源寄存器均为协处理器的寄存器，指令不涉及ARM处理器的寄存器和存储器。

CDP P5，2，C12，C10，C3，4

；该指令完成协处理器P5的初始化

LDC指令

LDC指令的格式为：

LDC{条件}{L} 协处理器编码,目的寄存器，[源寄存器]

LDC指令用于将源寄存器所指向的存储器中的字数据传送到目的寄存器中，若协处理器不能成功完成传送操作，则产生未定义指令异常。其中，{L}选项表示指令为长读取操作，如用于双精度数据的传输。

LDC P6，CR1，[R4]

；将ARM处理器的寄存器R4所指向的存储器中的字数据传送到协处理器P6的寄存器CR1中。

STC指令

STC指令的格式为：

STC{条件}{L} 协处理器编码,源寄存器，[目的寄存器]

STC指令用于将源寄存器中的字数据传送到目的寄存器所指向的存储器中，若协处理器不能成功完成传送操作，则产生未定义指令异常。其中，{L}选项表示指令为长读取操作，如用于双精度数据的传输。

STC P8，CR8，[R2，＃4]！

；将协处理器P8的寄存器CR8中的字数据传送到ARM处理器的寄存器R2＋4所指向的存储器中，R2=R2+4。

MCR指令

MCR指令的格式为：

MCR{条件} 协处理器编码，协处理器操作码1，源寄存器，目的寄存器1，目的寄存器2{，协处理器操作码2}

MCR指令用于将ARM处理器寄存器中的数据传送到协处理器寄存器中,若协处理器不能成功完成操作，则产生未定义指令异常。其中协处理器操作码1和协处理器操作码2为协处理器将要执行的操作，源寄存器为ARM处理器的寄存器，目的寄存器1和目的寄存器2均为协处理器的寄存器。

MCR P15，0，R0，C1，C0

；CP15 register 1:=R0

MRC指令

MRC指令的格式为：

MRC{条件} 协处理器编码，协处理器操作码1，目的寄存器，源寄存器1，源寄存器2，协处理器操作码2

MRC指令用于将协处理器寄存器中的数据传送到ARM处理器寄存器中,若协处理器不能成功完成操作，则产生未定义指令异常。其中协处理器操作码1和协处理器操作码2为协处理器将要执行的操作，目的寄存器为ARM处理器的寄存器，源寄存器1和源寄存器2均为协处理器的寄存器。

MRC P15，0，R0，C1，C0

；R0：=CP15 register 1

异常产生指令

ARM微处理器所支持的异常指令有如下两条：

SWI 软件中断指令

BKPT 断点中断指令

SWI指令

SWI指令的格式为：

SWI{条件} 24位的立即数

SWI指令用于产生软件中断，以便用户程序能调用操作系统的系统例程。操作系统在SWI的异常处理程序中提供相应的系统服务，指令中24位的立即数指定用户程序调用系统例程的类型，相关参数通过通用寄存器传递，当指令中24位的立即数被忽略时，用户程序调用系统例程的类型由通用寄存器R0的内容决定，同时，参数通过其他通用寄存器传递。

SWI 0x02

；该指令调用操作系统编号为02的系统例程。

BKPT指令

BKPT指令的格式为：

BKPT 16位的立即数

BKPT指令产生软件断点，引起Prefetch Abort 异常。可用于程序的调试。

u ARM体系结构除了支持执行效率很高的32位ARM指令集以外，同时支持16位的Thumb指令集。Thumb指令集是ARM指令集的一个子集，允许指令编码为16位的长度。与等价的32位代码相比较，Thumb指令集在保留32代码优势的同时，大大节省了系统的存储空间。

u 所有的Thumb指令都有对应的ARM指令，而且Thumb的编程模型也对应于ARM的编程模型，在应用程序的编写过程中，只要遵循一定调用的规则，Thumb子程序和ARM子程序就可以互相调用。当处理器在执行ARM程序段时，称ARM处理器处于ARM工作状态，当处理器在执行Thumb程序段时，称ARM处理器处于Thumb工作状态。

u 与ARM指令集相比较，Thumb指令集中的数据处理指令的操作数仍然是32位，指令地址也为32位，但Thumb指令集为实现16位的指令长度，舍弃了ARM指令集的一些特性，如大多数的Thumb指令是无条件执行的，而几乎所有的ARM指令都是有条件执行的；大多数的Thumb数据处理指令的目的寄存器与其中一个源寄存器相同。

u 由于Thumb指令的长度为16位，即只用ARM指令一半的位数来实现同样的功能，所以，要实现特定的程序功能，所需的Thumb指令的条数较ARM指令多。在一般的情况下，Thumb指令与ARM指令的时间效率和空间效率关系为：

u Thumb代码所需的存储空间约为ARM代码的60％～70％

u Thumb代码使用的指令数比ARM代码多约30％～40％

u 若使用32位数据宽度的存储器，ARM代码比Thumb代码快约40％

u 若使用16位数据宽度的存储器，Thumb代码比ARM代码快约40％～50％

u 与ARM代码相比较，使用Thumb代码，存储器的功耗会降低约30％

u 显然，ARM指令集和Thumb指令集各有其优点，若对系统的性能有较高要求，应使用32位的存储系统和ARM指令集，若对系统的成本及功耗有较高要求，则应使用16位的存储系统和Thumb指令集。当然，若两者结合使用，充分发挥其各自的优点，会取得更好的效果。

1. 单纯的跳转指令和带返回的跳转指令

（1）跳转指令的基本格式

<opcode>{<cond>}{S} <Rd>,<Rn>{,<opcode2>}

其中，<>内的项是必须的，{}内的项是可选的，如<opcode>是指令助记符，是必须的，而{<cond>}为指令执行条件，是可选的，如果不写则使用默认条件AL(无条件执行)。

opcode 指令助记符，如LDR，STR等

cond 执行条件，如EQ，NE等

S 是否影响CPSR 寄存器的值，书写时影响CPSR，否则不影响

Rd 目标寄存器

Rn 第一个操作数的寄存器

operand2 第二个操作数。在ARM指令中，灵活的使用第2个操作数能提高代码效率，第2个操作数的形式如0x3FC、0、0xF0000000、200，0xF0000001等。

指令格式举例如下：

LDR R0,[R1] ；读取R1地址上的存储器单元内容，执行条件AL

BEQ DATAEVEN ；跳转指令，执行条件EQ，即相等跳转到DATAEVEN

ADDS R1,R1,#1 ；加法指令，R1＋1＝R1 影响CPSR寄存器，带有S

SUBNES 1,R1,#0xD ；条件执行减法运算(NE),R1-0xD=>R1,影响CPSR寄存器,带有S

（2）条件码

几乎所有的ARM指令都包含一个可选择的条件码，即{<cond>}。使用指令条件码，可实现高效的逻辑操作，提高代码效率。ARM条件码如表所示。

操作码[31：28]
条件码助记符
标志
含义

0000
EQ
Z＝1
相等

0001
NE
Z＝0
不相等

0010
CS/HS
C=1
无符号数大于或等于

0011
CC/LO
C=0
无符号数小于

0100
MI
N=1
负数

0101
PL
N=0
正数或零

0110
VS
V=1
溢出

0111
VC
V=0
没有溢出

1000
HI
C=1，Z=0
无符号数大于

1001
LS
C=0，Z=1
无符号数小于或等于

1010
GE
N=V
带符号数大于或等于

1011
LT
N！=V
带符号数小于

1100
GT
Z=0，N=V
带符号数大于

1101
LE
Z=1，N！=V
带符号数小于或等于

1110
AL
任何
无条件执行（指令默认条件）

1.跳转指令

跳转指令用于实现程序流程的跳转，在 ARM 程序中有两种方法可以实现程序流程的跳转：

—使用专门的跳转指令。

—直接向程序计数器 PC 写入跳转地址值。

通过向程序计数器 PC 写入跳转地址值，可以实现在 4GB 的地址空间中的任意跳转，在跳转之前结合使用 MOV LR，PC 等类似指令，可以保存将来的返回地址值，从而实现在 4GB 连续的线性地址空间的子程序调用。

ARM 指令集中的跳转指令可以完成从当前指令向前或向后的 32MB 的地址空间的跳转，包括以下4条指令：

— B 跳转指令

— BL 带返回的跳转指令

— BLX 带返回和状态切换的跳转指令

— BX 带状态切换的跳转指令

B 指令的格式为：

B{条件} 目标地址

B 指令是最简单的跳转指令。一旦遇到一个 B 指令，ARM 处理器将立即跳转到给定的目标地址，从那里继续执行。注意存储在跳转指令中的实际值是相对当前 PC 值的一个偏移量，而不是一个绝对地址，它的值由汇编器来计算（参考寻址方式中的相对寻址）。它是24位有符号数，左移两位后有符号扩展为 32 位，表示的有效偏移为 26 位(前后 32MB 的地址空间)。以下指令：

B Label ；程序无条件跳转到标号Label处执行

CMP R1，＃0 ；当CPSR寄存器中的Z条件码置位时，程序跳转到标号Label处执行

BEQ Label

BL 指令的格式为：

BL{条件} 目标地址

BL 是另一个跳转指令，但跳转之前，会在寄存器 R14 中保存 PC 的当前内容，因此，可以通过将 R14 的内容重新加载到 PC 中，来返回到跳转指令之后的那个指令处执行。该指令是实现子程序调用的一个基本但常用的手段。以下指令：

BL Label ；当程序无条件跳转到标号Label处执行时，同时将当前的PC值保存到R14中

BLX 指令的格式为：

BLX 目标地址

BLX 指令从ARM 指令集跳转到指令中所指定的目标地址，并将处理器的工作状态有 ARM 状态切换到 Thumb 状态，该指令同时将 PC 的当前内容保存到寄存器 R14 中。因此，当子程序使用 Thumb 指令集，而调用者使用 ARM指令集时，可以通过 BLX指令实现子程序的调用和处理器工作状态的切换。同时，子程序的返回可以通过将寄存器 R14 值复制到 PC 中来完成。

BX 指令的格式为：

BX{条件} 目标地址

BX 指令跳转到指令中所指定的目标地址，目标地址处的指令既可以是 ARM 指令，也可以是 Thumb指令。

2. 转载 arm 的虚拟化原理

a、基本模型

Hypervisor运行在一个新的非安全模式，称为Hyp模式，Hypervisor负责客户操作系统的切换

客户操作系统运行在非安全特权和非特权模式。

用于安全扩展的软件不需要任何改变，因为Hypervisor本身没有用到安全模式的任何状态。

b、虚拟化的扩展如下

非安全状态下的Hyp模式

中断处理

内存管理

load和store的模拟来提供虚拟外设的处理

一些trap用来处理Hypervisor相关的特殊情况。

Hyp模式，是一种在非安全状态下最高的一种模式，能够控制比其他模式更多的功能。为了更好的对arm的虚拟化

进行描述，我们采用如下术语：

内核模式，是指六种模式的集合，Supervisor, System , Abort, FIQ和IRQ,Undef

特权模式，是指七种模式的集合，Supervisor, System , Abort, FIQ和IRQ,Undef，以及Monitor

非特权模式，是指一种模式的集合，即 User

Hyp模式在CPSR和SPSR中的模式编码中为11010

与其他的模式相同，Hyp需要有自己的SP和SPSR来保存自己的栈指针和状态，但是对于bank LR寄存器，会有一定的问题。理论上

我们应该允许Hypervisor在任何时刻都可以接收中断。但是当hypervisor模式下，hypervisor自己的LR保存着过程返回直的时候，

这时候如果有中断和异常发生，则会导致LR的数据被中断或者异常的返回地址覆盖。

c、指令的扩展

一个新的指令ERET

ERET的功能在于在 Hyp模式下执行的时候，Spsr_hyp的内容赋给CPSR而ELR_Hyp的值赋给PC

3. 跳转的方向性

bne %B0

1b，1f里的b和f表示backward和forward，1表示局部标签1

从最后的汇编语言来看，%B 代表，往前搜索　lable为0的行，换句话说，就是指本条语句前，lable为0的地址。整条语句的意思就是，如果不相等则跳转到lable为0的行。

1: ;A
cmp r0, #0
beq 1f ; r0==0那么向前跳转到B处执行
bne 1b ; 否则向后跳转到A处执行
1: ;B

4. 分类指令表

Cortex-M3 支持的指令在表 4.2 至表 4.9 列出。其中，译者添加了如下格式边框加粗的是从 ARMv6T2 才支持的指令。

双线边框的是从 Cortex-M3 才支持的指令（v7 的其它款式不一定支持）

译者添加

在讲指令之前，先简单地介绍一下 Cortex-M3 中支持的算术与逻辑标志。本书在后面还会展开论述。它们是：

APSR 中的 5 个标志位

	N:	负数标志(Negative)
	Z：	零结果标志(Zero)
	C:	进位/借位标志(Carry)
 	V: S:	溢出标志(oVerflow) 饱和标志(Saturation)，它不做条件转移的依据

4.2.1 分类指令表

表4.2 16位数据操作指令

名字	功能
ADC	带进位加法
ADD	加法
AND	按位与（原文为逻辑与，有误——译注）。这里的按位与和C的”&”功能相同
ASR	算术右移
BIC	按位清0（把一个数跟另一个无符号数的反码按位与）
CMN	负向比较（把一个数跟另一个数据的二进制补码相比较）
CMP	比较（比较两个数并且更新标志）
CPY	把一个寄存器的值拷贝到另一个寄存器中
EOR	近位异或
LSL	逻辑左移（如无其它说明，所有移位操作都可以一次移动最多31格——译注）
LSR	逻辑右移
MOV	寄存器加载数据，既能用于寄存器间的传输，也能用于加载立即数
MUL	乘法
MVN	加载一个数的NOT 值（取到逻辑反的值）
NEG	取二进制补码
ORR	按位或（原文为逻辑或，有误——译注）
ROR	圆圈右移
SBC	带借位的减法
SUB	减法
TST	测试（执行按位与操作，并且根据结果更新Z）
REV	在一个32 位寄存器中反转字节序
REVH	把一个32 位寄存器分成两个16 位数，在每个16 位数中反转字节序
REVSH	把一个32 位寄存器的低16 位半字进行字节反转，然后带符号扩展到32 位
SXTB	带符号扩展一个字节到32 位
SXTH	带符号扩展一个半字到32 位
UXTB	无符号扩展一个字节到32 位
UXTH	无符号扩展一个半字到32 位

表4.3 16位转移指令

名字	功能
B	无条件转移
B<cond>	条件转移
BL	转移并连接。用于呼叫一个子程序，返回地址被存储在LR 中
BLX #im	使用立即数的BLX不要在CM3 中使用
CBZ	比较，如果结果为0 就转移（只能跳到后面的指令——译注）
CBNZ	比较，如果结果非0 就转移（只能跳到后面的指令——译注）

IT If-Then

表4.4 16位存储器数据传送指令

名字	功能
LDR	从存储器中加载字到一个寄存器中
LDRH	从存储器中加载半字到一个寄存器中
LDRB	从存储器中加载字节到一个寄存器中
LDRSH	从存储器中加载半字，再经过带符号扩展后存储一个寄存器中
LDRSB	从存储器中加载字节，再经过带符号扩展后存储一个寄存器中
STR	把一个寄存器按字存储到存储器中
STRH	把一个寄存器存器的低半字存储到存储器中
STRB	把一个寄存器的低字节存储到存储器中
LDMIA	加载多个字，并且在加载后自增基址寄存器
STMIA	存储多个字，并且在存储后自增基址寄存器
PUSH	压入多个寄存器到栈中
POP	从栈中弹出多个值到寄存器中

16 数据传送指令没有任何新内容，因为它们是Thumb 指令，在v4T 时就已经定格了——译注

表4.5 其它16位指令

名字	功能
SVC	系统服务调用
BKPT	断点指令。如果使能了调试，则进入调试状态（停机）。否则的话产生调试监视器异常。在调试监视器异常被使能时，调用其服务例程；如果连调试监视器异常也被除能，则无奈下只好诉诸于一个fault 异常
NOP	无操作
CPSIE	使能PRIMASK(CPSIE i)/ FAULTMASK(CPSIE f)——清0 相应的位
CPSID	除能PRIMASK(CPSID i)/ FAULTMASK(CPSID f)——置位相应的位

表4.6 32位数据操作指令

名字	功能
ADC	带进位加法
ADD	加法
ADDW	宽加法（可以加12 位立即数）
AND	按位与（原文是逻辑与，有误。对应C 言的“\|”运算符——译注）
ASR	算术右移
BIC	位清零（把一个数按位取反后，与另一个数逻辑与）
BFC	位段清零
BFI	位段插入

CMN	负向比较（把一个数和另一个数的二进制补码比较，并更新标志位）
CMP	比较两个数并更新标志位
CLZ	计算前导零的数目
EOR	按位异或
LSL	逻辑左移
LSR	逻辑右移
MLA	乘加
MLS	乘减
MOVW	把16 位立即数放到寄存器的低16 位，高16 位清0
MOV	加载16 位立即数到寄存器（其实汇编器会产生MOVW——译注）
MOVT	把16 位立即数放到寄存器的高16 位，低16 位不影响
MVN	移动一个数的补码
MUL	乘法
ORR	按位或（原文为逻辑或，有误——译注）
ORN	把源操作数按位取反后，再执行按位或（原文为逻辑或，有误——译注）
RBIT	位反转（把一个32 位整数用2 进制表达后，再旋转180 度——译注）
REV	对一个32 位整数按字节反转
REVH/ REV16	对一个32 位整数的高低半字都执行字节反转
REVSH	对一个32 位整数的低半字执行字节反转，再带符号扩展成32 位数
ROR	圆圈右移
RRX	带进位位的逻辑右移一格（最高位用C 填充，执行后不影响C 的值——译注）
SFBX	从一个32 位整数中提取任意长度和位置的位段，并且带符号扩展成32 位整数
SDIV	带符号除法
SMLAL	带符号长乘加（两个带符号的 32 位整数相乘得到 64 位的带符号积，再把积加到另一个带符号64 位整数中）
SMULL	带符号长乘法（两个带符号的32 位整数相乘得到64 位的带符号积）
SSAT	带符号的饱和运算
SBC	带借位的减法
SUB	减法
SUBW	宽减法，可以减12 位立即数
SXTB	字节带符号扩展到32 位数
TEQ	测试是否相等（对两个数执行异或，更新标志但不存储结果）
TST	测试（对两个数执行按位与，更新Z 标志但不存储结果）
UBFX	无符号位段提取
UDIV	无符号除法
UMLAL	无符号长乘加（两个无符号的 32 位整数相乘得到 64 位的无符号积，再把积加到另一个无符号64 位整数中）
UMULL	无符号长乘法（两个无符号的32 位整数相乘得到64 位的无符号积）
USAT	无符号饱和操作（但是源操作数是带符号的——译注）
UXTB	字节被无符号扩展到32 位（高24 位清0——译注）

UXTH 半字被无符号扩展到32 位（高16 位清0——译注）

表4.7 32位存储器数据传送指令

名字	功能
LDR	加载字到寄存器
LDRB	加载字节到寄存器
LDRH	加载半字到寄存器
LDRSH	加载半字到寄存器，再带符号扩展到32 位
LDM	从一片连续的地址空间中加载若干个字，并选中相同数目的寄存器放进去
LDRD	从连续的地址空间加载双字（64 位整数）到2 个寄存器
STR	存储寄存器中的字
STRB	存储寄存器中的低字节
STRH	存储寄存器中的低半字
STM	存储若干寄存器中的字到一片连续的地址空间中，占用相同数目的字
STRD	存储2 个寄存器组成的双字到连续的地址空间中
PUSH	把若干寄存器的值压入堆栈中
POP	从堆栈中弹出若干的寄存器的值

表4.8 32位转移指令

名字	功能
B	无条件转移
BL	转移并连接（呼叫子程序）
TBB	以字节为单位的查表转移。从一个字节数组中选一个8 位前向跳转地址并转移
TBH	以半字为单位的查表转移。从一个半字数组中选一个16 位前向跳转的地址并转移

表4.9 其它32位指令

LDREX	加载字到寄存器，并且在内核中标明一段地址进入了互斥访问状态
LDREXH	加载半字到寄存器，并且在内核中标明一段地址进入了互斥访问状态
LDREXB	加载字节到寄存器，并且在内核中标明一段地址进入了互斥访问状态
STREX	检查将要写入的地址是否已进入了互斥访问状态，如果是则存储寄存器的字
STREXH	检查将要写入的地址是否已进入了互斥访问状态，如果是则存储寄存器的半字
STREXB	检查将要写入的地址是否已进入了互斥访问状态，如果是则存储寄存器的字节
CLREX	在本地处理器上清除互斥访问状态的标记（先前由LDREX/LDREXH/LDREXB 做的标记）
MRS	加载特殊功能寄存器的值到通用寄存器
MSR	存储通用寄存器的值到特殊功能寄存器
NOP	无操作
SEV	发送事件
WFE	休眠并且在发生事件时被唤醒
WFI	休眠并且在发生中断时被唤醒

ISB	指令同步隔离（与流水线和MPU 等有关——译注）
DSB	数据同步隔离（与流水线、MPU 和cache 等有关——译注）
DMB	数据存储隔离（与流水线、MPU 和cache 等有关——译注）

4.2.2 未支持的指令

有若干条 Thumb 指令没有得到 Cortex-M3 的支持，下表列出了未被支持的指令，以及不支持的原因。
表 4.10 因为不再是传统的架构，导致有些指令已失去意义

未支持的
指令
以前的功能