ARMv8(aarch64)指令集特性

 

有了之前mips系统架构的基础,再了解arm64就相对轻松多了。所谓体系架构,核心就是寄存器、指令集和abi(即寄存器和指令集的使用规范)。下面就分这几方面展开做的学习笔记。

目录

一、armv8概览

aarch64:

aarch32:

二、ARM64寄存器

1、ARM64通用寄存器

2、状态寄存器

2.1 条件标志位

2.2 控制位

2.3 保留位

3、ARM浮点寄存器

三、ARM64指令集

1、指令后缀

1.1    位数

1.2    S(S标识):影响CPSR里的NZCV标识位

 1.3    “!”后缀

1.4  条件后缀

2、数据处理(运算)指令:

2.1  数据传送指令

2.2  移位指令

2.3   算术运算指令

2.4 逻辑运算指令

2.5 比较运算指令

 2.6  乘除运算指令

3、数据加载/存储指令

4、跳转分支指令

5、程序状态寄存器的访问指令

6、协处理器指令

7、软中断指令

8、其他指令

四、使用规范ABI


一、armv8概览

 ARM架构版本号从1-8。ARMv8架构支持一下两种执行状态:

aarch64:

1、提供31个64位通用寄存器(其中X30被用来做链接寄存器LR(函数返回地址))。和一个64位程序计数器PC、栈帧SPs、异常链接寄存器ELRs。
3、提供32个128-bit寄存器用于SIMD vector and scalar floating-point support.
4、仅支持指令集 A64.
5、4个异常等级 EL0 - EL3
6、Defines a number of Process state (PSTATE) elements that hold PE state. The A64 instruction set includes instructions that operate directly on various PSTATE elements.
7、Names each System register using a suffix that indicates the lowest Exception level at which the register can be accessed.

aarch32:

1、提供13个32-bit通用寄存器,和一个32-bit PC, SP, 和链接寄存器 (LR)。LR 还兼有 ELR 功能。

2、提供32个64-bit寄存器用于SIMD vector and scalar floating-point support.

3、支持两种指令集 A32 (32bit编码的定长指令集)和 T32(使用16bit和32bit编码的变长指令集)。

 

二、ARM64寄存器

        ARM64寄存器分类:通用寄存器、浮点寄存器、状态寄存器、协处理器寄存器。本文就通用寄存器的使用来介绍。其他寄存器根据后期学习情况逐步补充。

 

1、ARM64通用寄存器

通用寄存器就是指用户态可以使用的寄存器。它和我们普通程序员关系最为密切。下表列举了ARM64的通用寄存器。

寄存器

描述

x0-x7

用于子程序调用时的参数传递,X0还用于返回值传递

x8-x15

临时寄存器,也叫可变寄存器,子程序使用时不需要保存。

x16-x17

子程序内部调用寄存器(IPx),使用时不需要保存,尽量不要使用

x18

平台寄存器,它的使用与平台相关,尽量不要使用。

x19-x28

临时寄存器,子程序使用时必须保存。

x29/fp

用于连接栈帧,使用时必须保存。

x30/LR

存放的是函数的返回“地址”。当ret指令执行时刻,会寻找x30寄存器保存的“地址值”!

SP

用于指向每个函数的栈顶。32位栈帧使用WSP。

 XZR

零寄存器。32位零寄存器为WZR

 

说明: x0 - x30 是31个通用整形寄存器。每个寄存器可以存取一个64位大小的数。 当使用 x0 - x30 访问时,它就是一个64位的数。当使用 w0 - w30 访问时,访问的是这些寄存器的低32位,如图:

 

2、状态寄存器

ARM体系架构中有一个当前程序状态寄存器CPSR(R16??)和5个备份状态寄存器SPSRs。先关注CPSR,CPSR可以在任何工作模式下访问,用来保存ALU中的当前信息、状态等。基本格式如下:

31                                                                26                  8                                                                                                                                  0

NZCVQ... ...IFTM4M3M2M1M0

如上图所示,CPSR分为3部分:条件标志位NZCVQ、控制位IFTM4M3M2M1M0、保留位。

2.1 条件标志位

        上图蓝色部分N,Z,C,V,Q为条件码标志位。它们内容可以根据算术或逻辑运算的结果所改变,并用来决定某条指令是否被执行。具体例子见 1.4 条件后缀   .   条件码标志的具体含义如下表:

标志位含义
N正负标志。N=1标识运算结果为负数
Z零标志。Z=1标识运算结果为0
C进位标志。加法运算结果有进位则C=1;
V溢出标志。运算结果有溢出则V=1
Q??

 

2.2 控制位

略,后期需要时补上

2.3 保留位

略,后期需要时补上

3、32 个SIMD&FP 寄存器 V0 -V31

每个寄存器根据实际使用长度,命名会有所不同。具体表示如下:

  • A 128-bit register named Q0 to Q31.

  • A 64-bit register named D0 to D31.

  • A 32-bit register named S0 to S31.

  • A 16-bit register named H0 to H31.

  • An 8-bit register named B0 to B31.

  • A 128-bit vector of elements.

  • A 64-bit vector of elements.

  • 如下图所示:

  •  

4、2 个SIMD&FP 控制寄存器 FPCR 、FPSR

  • Two SIMD and floating-point control and status registers, FPCR and FPSR.

 

三、Aarch64指令集

ARM64指令和其他架构,比如MIPS类似,把指令分为数据处理(运算)指令、加载与存储指令、分支指令、程序状态寄存器指令、协处理器指令和异常产生指令共6大类。其中程序状态寄存器指令为ARM特有,MIPS没有此类指令。下面分别介绍。

学习指令之前要了解一下指令后缀。

1、指令后缀

   ARM中的指令可以带后缀,从而丰富该指令的功能,常用的后缀有:

1.1    位数

           B(byte):功能不变,操作长度变为8位(依赖CPU位数,以下相同)

           H(Halfword):功能不变,操作长度变为16位

 例如:  ldr指令族:ldrb,ldrh,ldrsb ldrsh,从内存中加载指定长度的数据

 

1.2    S(S标识):影响CPSR里的NZCV标识位

指令中使用”S“后缀时、指令执行后程序状态寄存器的条件标志位将被刷新。相当于有符号运算。例如:

SUB    X1,X0,X3       ;X1=X0-X3  ,CPSR值不变

SUBS X1,X0,X3        ;X1=X0-X3 , 如果计算结果为负数,CPSR寄存器的N被置位

 

 1.3    “!”后缀

指令中地址表达式含有“!”后缀时,指令执行后,基址寄存器中的地址值将会发生变化。变化的结果是 (base+offset)。例如:

LDR X3,[X0,#4]       //X3=X0+4

LDR X3,[X0,#4]!      //X3=X0+4; X0+=4;

注意: “!”不能用于寄存器PC后面

1.4  条件后缀

        ARM架构中,允许在指令后面添加条件后缀来完成指令条件执行的目的。指令条件执行就是说,指令根据CPSR中条件码的状态和指令的条件域有条件的执行。当指令的执行条件满足时,指令被执行,否则指令将被忽略。例如比较下面两条指令:

ADD X4,X2,#1                    ; 无条件执行 X4=X2+1

ADDEQ  X4,X2,#1             ;添加有条件执行后缀EQ,当CPSR中的Z标志置位(之前某条CMP结果相等)时,该指令才执行。

注意:如果条件后缀和“S”标识同时出现,则S在条件后缀的后面,例如:

ADDEQS  X4,X2,#1          ;即为有条件执行X4=X2+1,结果更新条件标志位

ARM中支持的条件后缀(条件码)共16种(系统保留1种,剩下15种可用),具体标志和功能如下表:

指令码含义
EQZ置位 ;结果相等才执行
NEZ清零,结果不相等才执行
CSC置位,结果无符号>= 才执行
CCC清零,结果无符号< 才执行
MIN置位,结果为负数才执行
PLN清零,结果为正数或0才执行
VSV置位,结果溢出才执行
VCV清零,结果无溢出才执行
HIC置位Z清零,结果为无符号数大于才执行
LSC清零Z置位,结果为无符号数小于或等于才执行
GEN等于V,结果为有符号数大于或等于才执行
LTN不等于V,结果为有符号数小于才执行
GTZ清零且N等于V ,结果为有符号大于才执行
LEZ置位或N不等于V ,结果为有符号数小于或等于
AL无条件执行。省略。

例如:

cmp     w0, #0     ;
cset    x0, lt          ;如果(w0 < 0),X0置1,否则X0置0


说明:指令编程风格

ARM官方风格:官方风格指令一般使用大写,例如:LDR R0,[R1],Windows中常使用这种风格。

GUN Linux风格:指令一般使用小写字母,例如:ldr r0,[r1],Linux环境中常用这种风格.

本文下面的介绍多以官方风格来编写指令。

 

2、数据处理(运算)指令

 

2.1  数据传送指令

指令功能格式
MOV赋值MOV Wd|WSP, Wn|WSP ; 32-bit
MOV Xd|SP, Xn|SP ; 64-bit
MVN取反赋值MVN Wd, Wm{, shift #amount} ; 32-bit
MVN Xd, Xm{, shift #amount} ; 64-bit

例如:

MOV X1,X0 ;将寄存器X0赋值给X1

MVN X1,X2 ;将寄存器X2取反后传送给寄存器X1

2.2  移位指令

指令功能格式
LSL逻辑左移

LSL Wd, Wn, Wm ; 32-bit
LSL Xd, Xn, Xm ; 64-bit

LSR逻辑右移LSR Wd, Wn, Wm ; 32-bit
LSR Xd, Xn, Xm ; 64-bit
ASR算术右移ASR Wd, Wn, Wm ; 32-bit
ASR Xd, Xn, Xm ; 64-bit
ROR循环右移ROR Wd, Wn, Wm ; 32-bit
ROR Xd, Xn, Xm ; 64-bit

例如:

LSL     w1, w1, #1          ;将寄存器W1逻辑左移1位后,赋值给W1

MOV X0,X1,LSL#1   ;将寄存器X1左移1位后赋值给X0。

MOVS X0,X1,LSR#1  ;将寄存器X1逻辑右移1位后的值赋值给X0,如果X0结果为0,则置寄存器CPSR的N位

 

2.3   算术运算指令

指令功能格式
add

加法运算 

ADD Wd|WSP, Wn|WSP, #imm{, shift} ; 32-bit

 ADD Xd|SP, Xn|SP, #imm{, shift} ; 64-bit

sub减法运算SUB Wd|WSP, Wn|WSP, Wm{, extend {#amount}} ; 32-bit
SUB Xd|SP, Xn|SP, Rm{, extend {#amount}} ; 64-bit
rsb反减运算 
adc带进位的加法运算ADC Wd, Wn, Wm ; 32-bit
ADC Xd, Xn, Xm ; 64-bit
sbc带进位的减法运算SBC Wd, Wn, Wm ; 32-bit
SBC Xd, Xn, Xm ; 64-bit

例如:

ADC X1,X3,X5  ;X1=X3+X5+C(CPSR中的C位)

2.4 逻辑运算指令

指令功能格式
and与操作

AND Wd|WSP, Wn, #imm ; 32-bit
AND Xd|SP, Xn, #imm ; 64-bit

操作:Rd = Rn & imm ,where R is either W or X .

orr或操作

ORR Wd|WSP, Wn, #imm ; 32-bit
ORR Xd|SP, Xn, #imm ; 64-bit

操作:Rd = Rn | imm ,where R is either W or X .

eor异或操作

EOR Wd|WSP, Wn, #imm ; 32-bit
EOR Xd|SP, Xn, #imm ; 64-bit

操作 Rd = Rn ^ imm ,where R is either W or X

bic位清除操作

BIC Wd, Wn, Wm{, shift #amount} ; 32-bit
BIC Xd, Xn, Xm{, shift #amount} ; 64-bit

操作:Rd = Rn AND NOT shift(Rm, amount) ,where R is either W or X .

例如:

BIC X0,X0 #9    ;这里十进制数9对应的二进制数为101 ,故实现将寄存器X0的第0位和第3位清零。

2.5 比较运算指令

指令功能格式
CMP比较大小

CMP Wn|WSP, Wm{, extend {#amount}} ; 32-bit
CMP Xn|SP, Rm{, extend {#amount}} ; 64-bit

CMN反值比较

CMN Wn|WSP, Wm{, extend {#amount}} ; 32-bit
CMN Xn|SP, Rm{, extend {#amount}} ; 64-bit

TST按位与运算TST Wn, #imm ; 32-bit
TST Xn, #imm ; 64-bit    即 Rn AND imm where R is either W or X .

例如:

  CMP X1,#10   ;根据(R1-10)的结果更改CPSR的标志位

 CMN W0,W1   ; 根据(W0+W1)的结果更改CPSR的标志位

  TST X0,#3       ;X0&3 ,结果改变CPSR

 

 2.6  乘除运算指令

指令功能格式
mul乘法运算。MUL Wd, Wn, Wm ; 32-bit
MUL Xd, Xn, Xm ; 64-bit
UMULL64位无符号乘法UMULL Xd, Wn, Wm  => Xd = Wn * Wm
smull有符号乘法

SMULL Xd, Wn, Wm

等同于 SMADDL Xd, Wn, Wm, XZR .

SMADDL有符号乘加SMADDL Xd, Wn, Wm, Xa     =>    Xd = Xa + Wn * Wm
UDIV无符号除法UDIV Wd, Wn, Wm ; 32-bit
UDIV Xd, Xn, Xm ; 64-bit
SDIV有符号除法SDIV Wd, Wn, Wm ; 32-bit
SDIV Xd, Xn, Xm ; 64-bit

说明:ARM64中乘法,根据源操作数也分为32位64位乘法。由于64位乘法结果太大,需要放在2个64位寄存器Rdlo和寄存器Rdhi。寄存器Rdlo用于存放结果的低64位,寄存器Rdhi用于存放结果的高64位。类似于MIPS中的乘法寄存器HI和LO。

注意1:目的寄存器rd和操作数寄存器rm必须是不同的寄存器

 

3、数据加载/存储指令

ARM64的数据加载/存储,类似于MIPS体系架构的load/store。

指令功能格式
LDR32/64位加载寄存器LDR Wt, [Xn|SP, (Wm|Xm){, extend {amount}}] ; 32-bit
LDR Xt, [Xn|SP, (Wm|Xm){, extend {amount}}] ; 64-bit
LDRB加载一个字节LDRB Wt, [Xn|SP], #simm ; Post-index general registers
LDRB Wt, [Xn|SP, #simm]! ; Pre-index general registers
LDRB Wt, [Xn|SP{, #pimm}] ; Unsigned offset general registers
LDRH加载半字LDRH Wt, [Xn|SP], #simm ; Post-index general registers
LDRH Wt, [Xn|SP, #simm]! ; Pre-index general registers
LDRH Wt, [Xn|SP{, #pimm}] ; Unsigned offset general registers
LDRSB加载有符号字节LDRSB Wt, [Xn|SP], #simm ; 32-bit, Post-index
LDRSB Xt, [Xn|SP], #simm ; 64-bit, Post-index
LDRSB Wt, [Xn|SP, #simm]! ; 32-bit, Pre-index
LDRSB Xt, [Xn|SP, #simm]! ; 64-bit, Pre-index
LDRSB Wt, [Xn|SP{, #pimm}] ; 32-bit
LDRSB Xt, [Xn|SP{, #pimm}] ; 64-bit
STR32/64位存储STR Wt, [Xn|SP, (Wm|Xm){, extend {amount}}] ; 32-bit
STR Xt, [Xn|SP, (Wm|Xm){, extend {amount}}] ; 64-bit
STRH半字存储STRH Wt, [Xn|SP, (Wm|Xm){, extend {amount}}]
SWP交换指令 

例如:

LDR X3,[X2,#0x8]  ; load memory(X2+0x8)  to X3

STR X6,[X5,X3]   ; store X6 to memory(X5+X3)

SWP X0,X1,[X2]  ;将memory(X2)数据加载到X0,同时将X1中的数据存储到memory(X2)

注意:没有找到教材中说的多寄存器加载/存储指令 LDM/STM。不知道是否为伪指令?

4、跳转分支指令

类似于MIPS架构的B/J指令。用于分支跳转和函数调用。

指令功能格式
B

无条件跳转,不返回

in the range ±128MB

B label
BL

跳转前把返回地址放入x30(LR)中

range ±128MB

setting the register X30 to PC+4

BL label

BR跳转到寄存器BR Xn
BLR

寄存器跳转。跳转前把返回地址放入x30(LR)中

长跳转range 2的64次方-1

BLR Xn
BX跳转同时切换到ARM模式,用于异常处理的跳转
CBZ比较Rt结果为零(Zero)则跳转

CBZ Rt, label      ; 64-bit   R为Xt或者Wt

BEQCPSR中Z置位则跳转

BEQ label   ; UAL(A32/T32)

B.EQ label  ; A64

例如:

 cmp     w0, #15     //将(w0-15)结果更新CPSR标志位
 beq     label           //如果(w0==15) ,则跳转到lable

 

5、程序状态寄存器的访问指令

由于程序状态寄存器不属于通用寄存器,故不能直接读取,而是要通过下面两条指令专门读取。

指令功能格式
MRS读状态寄存器MRS Xt, (systemreg|Sop0_op1_Cn_Cm_op2)
MSR写状态寄存器

MSR pstatefield, #imm

MSR (systemreg|Sop0_op1_Cn_Cm_op2), Xt

例如:

MRS X0,SPSR    ;读SPSR的内容到X0

MSR CPSR_c,X0   ;写寄存器X0值到CPSR,仅修改CPSR的控制位域c

 

6、协处理器指令

略,后期需要时补上

指令功能格式
CDP  
LDC  
STC  
MCR  
MRC  

 

7、软中断指令

FIXME:SVC was called SWI in earlier versions of the A32 assembly language. SWI instructions disassemble to SVC ,
with a comment to say that this was formerly SWI .

指令功能格式
SVC软件中断SVC{cond} #imm

swi(software interrupt),在软件层模拟产生一个中断,这个中断会传送给CPU,常用于实现系统调用。类似于mips架构的syscall指令。

待确认,如何使用此指令,根据系统调用号ID来实现系统调用

 

8、其他指令

暂时把无法归类的指令称为其他指令吧。

指令功能格式
BRKARM64的断点指令,imm标识一个不大于16位的立即数BRK #imm   
BKPTARM32的断点指令,imm标识一个不大于16位的立即数BKPT #imm
clz统计一个数的二进制位前面有几个0CLZ{cond} Rd, Rm

 断点指令BRK/BKPT可以触发SIGTRAP中断,   类似于mips架构的break指令。

缺少示例

 

四、使用规范ABI

略,后期需要时补上

 

 

 

 

  • 9
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

海棠花败

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值