【汇编】x87 FPU

最新推荐文章于 2024-08-02 17:56:54 发布

76丶

最新推荐文章于 2024-08-02 17:56:54 发布

阅读量1k

点赞数 19

文章标签：汇编 c++ c语言

本文链接：https://blog.csdn.net/qq_52340390/article/details/140247804

版权

FPU

FPU提供8个80位的浮点数据寄存器，这些寄存器被组织成一个栈，MASM将这些称为ST(0)······ST(7)。

图1-1 FPU浮点数据寄存器栈

x87 FPU的16位控制字用于控制x87 FPU的精度和舍入方式。它还包含x87 FPU浮点异常掩码位。控制字缓存在x87 FPU控制寄存器中。该寄存器的内容可以用FLDCW指令加载，通过FSTCW / FNSTCW指令加载到内存。

图1-2 FPU控制字

0-5：无效操作，非规范化，零除，向上溢出，向下溢出，精度

8-9：精度控制

10-11：舍入控制

12：无穷控制

其它：保留位

x87 FPU的16位状态寄存器显示x87 FPU的当前状态。flags在x87的FPU状态寄存器包括，FPU busy、栈顶指针、条件码标志、溢出标志、堆栈故障标志和异常标志。x87 FPU在这个寄存器中设置标志来显示操作的结果。

图1-3 FPU状态寄存器

0-7：无效操作，非规范化，零除，向上溢出，向下溢出，精度，栈故障，异常

8,9,10,14：条件码

11-13：栈指针的顶部

15：忙/空闲

FPU数据类型

整数：16位，32位，64位

压缩10进制：18位有符号十进制（BCD）整数

浮点：32位，64位，80位(80为非规范化)

FPU指令集

fld：将浮点数值入栈

fst，fstp：将浮点栈顶复制到另一个浮点寄存器中

fxch：将浮点栈顶与另一个FPU寄存器进行交换

fild：将整数扩展为80位浮点数

fist,fistp,fisttp：将80位浮点数转为整数

fbld,fbstp：加载并存储80位BCD数值

fadd,faddp,fiadd：无操作数指令取栈顶两个浮点数相加存放到栈中，fadd有操作数相加存放到目标寄存器中，faddp有操作数相加然后弹出st(0)，内存操作数相加到st(0)中

fadd
faddp

fadd	st(i),st(0)
fadd	st(0),st(i)
faddp	st(i),st(0)

fadd	mem32
fadd	mem64
fiadd	mem32
fiadd	mem64

fsub,fsubp,fsubr,fisub,fisubr

fmul,fmulp,fimul

fdiv,fdivp,fdivr,fdivrp,fidiv,fidivr

fsqrt：计算栈顶的平方根，栈顶必须为0或正数，否则将生成无效操作异常

frndint：将栈顶数值舍入为最接近的整数

fabs：通过清除st(0)尾数符号来计算st(0)的绝对值。如果栈为空，将设置栈异常位和无效操作位

fchs：反转尾数符号更改st(0)值的符号。如果栈为空，将设置栈异常位和无效操作位。

fcom,fcomp,fcompp,fcomi,fcomip：与st(0)比较

fcom
fcomp
fcompp

fcom 	st(i)
fcomp 	st(i)

fcom	mem32
fcom	mem64
fcomp	mem32
fcomp	mem64

fcomi	st(0),st(i)
fcomip	st(0),st(i)

ftst：将st(0)与0.0进行比较

fldz,fld1,fldpi,fldl2t,fldlg2,fldln2：常量指令

f2xm1,fsin,fcos,fsincos,fptan,fpatan,fyl2x,fyl2xp1：超越函数指令

finit,fninit：对fpu初始化，fninit不检查挂起浮点异常。

fldcw,fstcw：加载储存控制字

fclex,fnclex：清除fpu状态寄存器中的所有异常位，栈故障位和busy flag位。

fstsw,fnstsw：将状态寄存器储存到16位内存单元或ax寄存器中

代码

main.cpp

//main.cpp
#include<iostream>

using namespace std;

extern "C"{
    double dadd(double a,double b);
    double dsub(double a,double b);
    double dmul(double a,double b);
    double ddiv(double a,double b);
}

int main(){
    double a=1.1;
    double b=2.2;
    cout<<dadd(a,b)<<endl;
    cout<<dsub(a,b)<<endl;
    cout<<dmul(a,b)<<endl;
    cout<<ddiv(a,b)<<endl;
    return 0;
}

fpu.asm

//fpu.asm
    option casemap:none

    .data 
    a   real8 ?
    b   real8 ?
    
    .code 
    public dadd
dadd proc
    finit
    movsd   a,xmm0
    movsd   b,xmm1
    fld     a
    fld     b
    fadd
    fst     a
    movsd   xmm0,a
    ret
dadd endp

    public dsub
dsub proc
    finit
    movsd   a,xmm0
    movsd   b,xmm1
    fld     a
    fld     b
    fsub
    fst     a
    movsd   xmm0,a
    ret
dsub endp

    public dmul
dmul proc
    finit
    movsd   a,xmm0
    movsd   b,xmm1
    fld     a
    fld     b
    fmul
    fst     a
    movsd   xmm0,a
    ret
dmul endp

    public ddiv
ddiv proc
    finit
    movsd   a,xmm0
    movsd   b,xmm1
    fld     a
    fld     b
    fdiv
    fst     a
    movsd   xmm0,a
    ret
ddiv endp
end

参考

[美]兰德尔·海德.64位汇编语言的编程艺术
Intel® 64 and IA-32 Architectures Software Developer’s Manual Combined Volumes: 1, 2A, 2B, 2C, 2D, 3A, 3B, 3C, 3D, and 4
AMD64 Architecture Programmer’s Manual Volumes 1–5