cva6学习笔记-更新中

Dogisme

已于 2024-03-12 09:10:42 修改

阅读量2k

点赞数 26

分类专栏： riscv cpu 文章标签： risc-v

于 2024-03-11 18:22:29 首次发布

本文链接：https://blog.csdn.net/Dogisme/article/details/136631294

版权

riscv cpu 专栏收录该内容

2 篇文章

订阅专栏

1 cva6总览

Ariane处理器是一个6级流水线、顺序、单发射、64bit处理器，它完整的实现了非特权手册中的IMAFDC指令集，以及特权手册中的MSU特权等级，以支持类Unix操作系统。上图是论文中给出的微架构图，但在实际阅读源码的过程中，发现与论文还是有很多出入的，详细描述见后面章节。

1.1功能描述

Feature	Description
ISA	RISCV64 GC
order	in-order
issue width	1
pipelined	6 (实际大于6)
mode	MSU
frequency	1.7GHZ(22nm)
peak efficiency	40 Gop/sW
core interface	1组axi64，1组协处理器接口，1组trace接口
virtual memory	sv39
FPU	-
icache latency	1
dcache latency	3

1.2 设计目标

主要设计目标是减少关键路径长度，同时保持每周期指令数（IPC）的损失在适度范围内。目标逻辑深度低于30个NAND门当量（GEs）

1.3 顶层接口

信号名	位宽	描述
clk_i	1	时钟
rstn_i	1	复位
boot_addr_i	VLEN	boot地址
hart_id_i	XLEN	hart id
irq_i	2	m和s中断
ipi_i	1	处理器之间的中断
time_irq_i	1	计时器中断
debug_req_i	1	调试中断
rvfi_o.		trace相关的所有输出信号，详见后面章节
cvxif_req_o.		协处理器相关的所有输出信号详见后面章节
cvxif_resp_i.		协处理器相关的所有输入信号详见后面章节
noc_req_o		axi64_mst端口的所有输出信号
noc_resp_i		axi64_mst端口的所有输入信号

1.4 流水线划分

2 Frontend（前段）

2.1 Frontend流水线划分

如下图，在Frontend部分，分为4级流水：fetch0（取指0）、fetch1（取指1）、align/minidecode/prediction（指令对齐&微解码&分支预测）、ints_buffer(指令缓存)。pc_gen(pc生成)在fetch0阶段。

为了减小读取icahce的延迟，将取指分为两级流水，这导致了预测和取指没有实现背靠背，在预测结果是跳转时，将产生1个周期的惩罚。但由于支持压缩指令和ints_buffer的存在，仍然可以为后续流水提供连续指令。

此外，为了将惩罚减小到1个周期，得到的分支预测地址会直接用于当拍的取指，这带来了前段部较长的组合逻辑：align->minidecode->prediction->pc_gen（对齐/预解码和预测是并行的）。

如下图：红色标识表示各级流水.

2.2 PC生成

如下图，pc_gen生成fecth0的请求地址。

优先级顺序	描述
1 boot_pc	复位释放后的起始地址
2 bp_pc	预测跳转时，来自BTB/RTS的地址。
3 debug_pc	进入debug模式时的地址，地址为0x800
4 flush_pc	由于一些特殊的指令比如同步内存和I/O的fence指令会导致流水线刷新，从提交的指令地址 + 4 重新取指。
5 ex_pc	异常和中断导致的跳转，跳转地址依据特权等级以及mtvec、stvec等计算。
6 eret_pc	遇到从环境调用中返回指令mret、sret、dret，则下个取指地址分别为CSR寄存器mepc、sepc、dpc中记录的数值。
7 misperdict_pc	分支预测错误，从执行阶段计算的地址开始取指。
8 replay_pc	ints_buffer满时,按分支预测阶段（第三级流水）的地址重新取指。（为防止过长的反压组合逻辑）
9 default	{pc[31:2],2’b0}+4