RV32I指令集及其编码方式解读

乖乖是干饭王

已于 2024-05-09 17:28:00 修改

阅读量1.1k

点赞数 5

分类专栏：计算机体系结构文章标签：硬件工程硬件架构笔记 risc-v

于 2024-05-09 17:22:28 首次发布

本文链接：https://blog.csdn.net/qq_45226456/article/details/138467861

版权

前言

$R I SC - V$ 表示精简指令集计算机 $\ Instruction \ Set \ Computer)$ 的第五代指令集。其主要特点在于：指令长度固定，指令数量精简，通常在一个时钟周期内完成，且 $R I SC V$ 完全开源。

而与其相对的 $\ Instruction \ Set \ Computer)$ 相比更加简洁高效。我们熟知的 $x 86$ 其经过多年发展以及向前兼容的要求使得指令集非常繁杂，且授权费用高昂。

面向 $32$ 位的 $R I SC V$ 指令集称为 $R V 32$ ，另外对应有 $64$ 位的 $R V 64$ 和 $128$ 位的 $R V 128$ 。本文将以 $R V 32$ 为主体，向大家详细介绍 $32$ 位基础指令集 $R V 32 I$ 的指令编码及其具体格式以及一些指令编码时立即数位置奇怪的原因。

RISCV指令集的模块化

$R I SC V$ 的指令集按照不同的功能分为不同的子模块，以 $R V 32$ 为例，模块用 $R V 32$ +字母命名，一个 $R I SC V$ 指令集必须包含基础指令集 $R V 32 I$ 以及可选的扩展部分，扩展部分包括标准扩展和用户自定义扩展。基础以及部分标准扩展指令集如下表所示：

RV32模块	全称	用途
RV32I	Base Integer Instruction Set	加减法，访问内存，控制转移分支指令，环境调用断点，内存屏障
RV32M	Integer Multiplication and Division	整数乘法除法
RV32F	Single-Precision Floating Point	单精度浮点数
RV32D	Double-Precision Floating Point	双精度浮点数
RV32Q	Quad-Precision Floating Point	四倍精度浮点数
RV32C	Compressed Instruction	压缩指令，指令字长16bit，用于对指令大小有限制的环境
RV32A	Atomic Instruction	原子指令，用于OS支持
RV32V	Vector Operation	向量运算
RV32E		通用寄存器变为16个，用作简单嵌入式设备，其余和RV32I基本一致

表中并未包含全部标准扩展，仅列出部分作为参考。

RV32I

$R V 32 I$ 中共有指令格式 $6$ 种，核心四种为 $\ I \ S \ U$ 。六种指令格式分别是：
$1$ ： $R$ 型指令，用于寄存器和寄存器之间的算术运算。
$2$ ： $I$ 型指令，用于寄存器和立即数之间的算术运算以及用于从内存中加载数据。
$3$ ： $S$ 型指令，用于向内存存储数据。
$4$ ： $B$ 型指令，用于短距离分支指令。 $S$ 型指令的变体。
$5$ ： $U$ 型指令，用于立即数高 $20 bi t$ 操作指令。
$6$ ： $J$ 型指令，用于长距离跳转。 $U$ 型指令的变体。

其中，通用寄存器 $32$ 个，从 $x 0 - x 31$ ，共需 $5 bi t$ 表示。其中， $x 0$ 被硬连线到 $0$ 。
另有一个寄存器： $p c$ ，用于存储当前正在执行的指令的地址。

四种主要的指令编码方式如下图所示：
在这里插入图片描述
可以看到，为了方便硬件设计，所有指令都保持 $\ rs \ rd \ funct$ 字段在寄存器位置的一致 (有例外，但 $R V 32 I$ 中没有)。 $f u n c t 3$ 字段主要用于区分具体的指令。

$f u n c t 7$ 字段主要用于以后的扩展，指令中只使用很少一部分。例如： $S U B, S U B W, SR A, SR A I, SR A I W$ 指令使用 $f u n c t 7 = 0 b 0100000$ 相对于指令 $A DD, A DD W, SR L, SR L I, SR L I W$ 中 $f u n c t 7 = 0 b 0000000$ 只有很小的改动，该位主要用于对结果进行符号扩展。

其中， $o p co d e$ 长度为 $7$ ，占据指令 $in s t [6 : 0]$ 。一种 $o p co d e$ 代表了一种类别的操作， $o p co d e$ 具体映射如下表所示：

在这里插入图片描述
1： $o p co d e$ 最低两位 $in s t [1 : 0]$ 必须为 $1$ 则指令有效。
2： $o p co d e$ 并不完全由 $R I S U J B$ 这些指令格式决定，同样是 $I$ 型指令， $\ \ addi$ 有着不同的 $o p co d e$ 。

另外，标准原话："There is no dedicated stack pointer or subroutine return address link register in the Base Integer ISA; the instruction encoding allows any x register to be used for these purposes." 标准基础指令集中并未规定某一个特定寄存器用于堆栈指针和函数返回值的存储。但是按照调用约定， $x 1$ 用于存储返回值，而 $x 2$ 用于作为堆栈指针使用。具体如下图所示：

在这里插入图片描述