CV32E40P处理器源码剖析(三):EX_Stage

本文详细解析了CV32E40P处理器的EX_Stage模块,包括alu和mult模块的功能,加减、移位、比较、位操作以及乘法(包括32位和16位)和除法的实现过程。
摘要由CSDN通过智能技术生成

原文链接:CV32E40P处理器源码剖析(三):EX_Stage - 知乎 (zhihu.com)

cv32e40p_ex_stage负责实现指令执行功能,内部由cv32e40p_alu和cv32e40p_mult两个模块组成。其中cv32e40p_alu模块负责执行加、减、与、或、移位等操作,cv32e40p_mult模块负责实现乘法操作。除法功能在cv32e40p_alu模块中实现。

cv32e40p_ex_stage内部组成

1. 执行阶段剖析

cv32e40p_ex_stage除了包含cv32e40p_alu和cv32e40p_mult两个模块,还实现:

  • ALU计算结果写回寄存器的赋值功能{regfile_alu_wdata_fw_o,regfile_alu_waddr_fw_o,regfile_alu_we_fw_o};

  • 访存结果写回寄存器的赋值功能{regfile_wdata_wb_o,regfile_waddr_wb_o,regfile_we_wb_o};

  • 条件分支指令结果输出;

 
 

assign branch_decision_o = alu_cmp_result; assign jump_target_o = alu_operand_c_i;

  • 控制信号赋值,ex_ready_o反压id_stage,ex_valid_o传导回id_stage;

 
 

assign ex_ready_o = (~apu_stall & alu_ready & mult_ready & lsu_ready_ex_i & wb_ready_i & ~wb_contention) | (branch_in_ex_i); assign ex_valid_o = (apu_valid | alu_en_i | mult_en_i | csr_access_i | lsu_en_i) & (alu_ready & mult_ready & lsu_ready_ex_i & wb_ready_i);

2. 模块内部设计

2.1 cv32e40p_alu

cv32e40p_alu模块内部处理逻辑大致可以分为五块:

1)加减操作

首先,使用adder_in_a/b的作用是记录进位/借位功能。考虑到cv32e40p支持向量处理,即将32b数据拆分为4个8b数据,因此adder也拆分为4端,根据8b/16b/32b操作需求,插入相应的4b数值。

其次,执行加减操作。其中,减操作时将b操作数取反再与a操作数相加。ALU_ADDR/ ALU_ADDRU/ ALU_SUBR/ ALU_SUBUR,实现操作数(op_a+op_b+2^(bmask_b_i-1))>> bmask_b_i。

2)移位操作

Shift操作包含三类:a)shift_amt_norm,针对的ADD/SUB以及基于ADD/SUB扩展的定制指令;b)shift_left,针对左移、统计前导0/1个数、找尾1、除法、取余操作;c)剩下的操作类型,如右移、算数右移、与、或等。其中,左移操作是通过操作数取逆,右移,再取逆得到的。

 
 

assign shift_left = (operator_i == ALU_SLL) || (operator_i == ALU_BINS) || (operator_i == ALU_FL1) || (operator_i == ALU_CLB) || (operator_i == ALU_DIV) || (operator_i == ALU_DIVU) || (operator_i == ALU_REM) || (operator_i == ALU_REMU) || (operator_i == ALU_BREV); assign shift_use_round = (operator_i == ALU_ADD) || (operator_i == ALU_SUB) || (operator_i == ALU_ADDR) || (operator_i == ALU_SUBR) || (operator_i == ALU_ADDU) || (operator_i == ALU_SUBU) || (operator_i == ALU_ADDUR) || (operator_i == ALU_SUBUR); assign shift_arithmetic = (operator_i == ALU_SRA) || (operator_i == ALU_BEXT) || (operator_i == ALU_ADD) || (operator_i == ALU_SUB) || (operator_i == ALU_ADDR) || (operator_i == ALU_SUBR); // choose the bit reversed or the normal input for shift operand a assign shift_op_a = shift_left ? operand_a_rev : (shift_use_round ? adder_round_result : operand_a_i); assign shift_amt_int = shift_use_round ? shift_amt_norm : (shift_left ? shift_amt_left : shift_amt); assign shift_amt_norm = is_clpx_i ? {clpx_shift_ex, clpx_shift_ex} : {4{3'b000, bmask_b_i}};

3)比较逻辑

  • 首先,设置需要比较大小的数据类型,32b,16b,8b,即使用4b位宽cmp_signed信号标识;

  • 其次,判断操作数a与b是否相等,操作数a是否大于b,分别用is_equal_vec、is_greater_vec记录;

  • 第三,根据指令类型,记录判断结果,输出最高bit,作为分支跳转判断结果;

 
 

always_comb begin cmp_result = is_equal; unique case (operator_i) ALU_EQ: cmp_result = is_equal; ALU_NE: cmp_result = ~is_equal; ALU_GTS, ALU_GTU: cmp_result = is_greater; ALU_GES, ALU_GEU: cmp_result = is_greater | is_equal; ALU_LTS, ALU_SLTS, ALU_LTU, ALU_SLTU: cmp_result = ~(is_greater | is_equal); ALU_SLETS, ALU_SLETU, ALU_LES, ALU_LEU: cmp_result = ~is_greater; default: ; endcase end

  • 第四,根据比较结果,选择大/小的数据,实现max/min功能。其中,ABS操作,a操作数与b操作数(0)对比,若大于b,则取a,否则取~a。

4)位操作

位操作大致可以分为以下几类:

  • 首1/尾1/前导0个数查找逻辑,cv32e40p_ff_one采用的是二分(树)查找思想;

  • 1个数统计,采用的分层两两累加的思想;

  • 位取逆操作,分为三类,一类是逐1b取逆,如0010_0001 -> 1000_0100;二是逐2b取逆,如0010_0001 -> 0100_1000;三是逐3b取逆,如0010_0001 -> 1000_0001;

5)除法操作,由cv32e40p_alu_div模块实现,具体实现细节这里不展开介绍。

2.2 cv32e40p_mult

乘法操作包含两种模式,一是a*b+c,二是点乘(a[3:0]*b[3:0])。

1)a*b+c

该模式下包含两类乘法指令,即32位乘法,16位乘法;

  • 32位乘法包含MUL_MSU32和MUL_MAC32,其中MSU32执行的动作rd=rd-rs1*rs2=rd+ [rs1]补码*rs2;MUL_MAC32执行的动作为rd=rd+rs1*rs2,可以合并执行。值得注意的是标准乘法指令mul是mul_mac32的特殊情况,即op_c_i=0。

 
 

assign int_is_msu = (operator_i == MUL_MSU32); assign int_op_a_msu = op_a_i ^ {32{int_is_msu}}; assign int_op_b_msu = op_b_i & {32{int_is_msu}}; assign int_result = $signed(op_c_i) + $signed(int_op_b_msu) + $signed(int_op_a_msu) * $signed(op_b_i);

  • 16位乘法包含MUL_I, MUL_IR和MUL_H,MUL_I, MUL_IR相对简单,直接执行a*b+c即可;MUL_H中包含mulh/mulhsu/mulhu标准乘法指令,直接32b*32b操作存在溢出,因此需要执行4次16b乘法操作,再求和,高位结果输出。

2)点乘

相对简单,将4/2组8b/16b数据相乘求和。

  • 8
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
使用 JavaScript 编写的记忆游戏(附源代码)   项目:JavaScript 记忆游戏(附源代码) 记忆检查游戏是一个使用 HTML5、CSS 和 JavaScript 开发的简单项目。这个游戏是关于测试你的短期 记忆技能。玩这个游戏 时,一系列图像会出现在一个盒子形状的区域中 。玩家必须找到两个相同的图像并单击它们以使它们消失。 如何运行游戏? 记忆游戏项目仅包含 HTML、CSS 和 JavaScript。谈到此游戏的功能,用户必须单击两个相同的图像才能使它们消失。 点击卡片或按下键盘键,通过 2 乘 2 旋转来重建鸟儿对,并发现隐藏在下面的图像! 如果翻开的牌面相同(一对),您就赢了,并且该对牌将从游戏中消失! 否则,卡片会自动翻面朝下,您需要重新尝试! 该游戏包含大量的 javascript 以确保游戏正常运行。 如何运行该项目? 要运行此游戏,您不需要任何类型的本地服务器,但需要浏览器。我们建议您使用现代浏览器,如 Google Chrome 和 Mozilla Firefox, 以获得更好、更优化的游戏体验。要玩游戏,首先,通过单击 memorygame-index.html 文件在浏览器中打开游戏。 演示: 该项目为国外大神项目,可以作为毕业设计的项目,也可以作为大作业项目,不用担心代码重复,设计重复等,如果需要对项目进行修改,需要具备一定基础知识。 注意:如果装有360等杀毒软件,可能会出现误报的情况,源码本身并无病毒,使用源码时可以关闭360,或者添加信任。
使用 JavaScript 编写的 Squareshooter 游戏及其源代码   项目:使用 JavaScript 编写的 Squareshooter 游戏(附源代码) 这款游戏是双人游戏。这是一款使用 JavaScript 编写的射击游戏,带有门户和强化道具。在这里,每个玩家都必须控制方形盒子(作为射手)。这款射击游戏的主要目标是射击对手玩家以求生存。当它射击对手时,它会获得一分。 游戏制作 该游戏仅使用 HTML 和 JavaScript 开发。该游戏的 PC 控制也很简单。 对于玩家 1: T:朝你上次动作的方向射击 A:向左移动 D:向右移动 W:向上移动 S:向下移动 对于玩家2: L:朝你上次移动的方向射击 左箭头:向左移动 右箭头:向右移动 向上箭头:向上移动 向下箭头:向下移动 游戏会一直进行,直到您成功射击对手或对手射击您为止。游戏得分显示在顶部。所有游戏功能均由 JavaScript 设置,而布局和其他次要功能则由 HTML 设置。 如何运行该项目? 要运行此项目,您不需要任何类型的本地服务器,但需要浏览器。我们建议您使用现代浏览器,如 Google Chrome 和 Mozilla Firefox。要运行此游戏,首先,通过单击 index.html 文件在浏览器中打开项目。 演示: 该项目为国外大神项目,可以作为毕业设计的项目,也可以作为大作业项目,不用担心代码重复,设计重复等,如果需要对项目进行修改,需要具备一定基础知识。 注意:如果装有360等杀毒软件,可能会出现误报的情况,源码本身并无病毒,使用源码时可以关闭360,或者添加信任。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值