【汇编】x87 FPU

FPU

        FPU提供8个80位的浮点数据寄存器,这些寄存器被组织成一个栈,MASM将这些称为ST(0)······ST(7)。

图1-1 FPU浮点数据寄存器栈

        x87 FPU的16位控制字用于控制x87 FPU的精度和舍入方式。它还包含x87 FPU浮点异常掩码位。控制字缓存在x87 FPU控制寄存器中。该寄存器的内容可以用FLDCW指令加载,通过FSTCW / FNSTCW指令加载到内存。

图1-2 FPU控制字

        0-5:无效操作,非规范化,零除,向上溢出,向下溢出,精度

        8-9:精度控制

        10-11:舍入控制

        12:无穷控制

        其它:保留位

        x87 FPU的16位状态寄存器显示x87 FPU的当前状态。flags在x87的FPU状态寄存器包括,FPU busy、栈顶指针、条件码标志、溢出标志、堆栈故障标志和异常标志。x87 FPU在这个寄存器中设置标志来显示操作的结果。

图1-3 FPU状态寄存器

        0-7:无效操作,非规范化,零除,向上溢出,向下溢出,精度,栈故障,异常

        8,9,10,14:条件码

​        11-13:栈指针的顶部

​        15:忙/空闲

FPU数据类型

        整数:16位,32位,64位

        压缩10进制:18位有符号十进制(BCD)整数

        浮点:32位,64位,80位(80为非规范化)

FPU指令集

        fld:将浮点数值入栈

        fst,fstp:将浮点栈顶复制到另一个浮点寄存器中

        fxch:将浮点栈顶与另一个FPU寄存器进行交换

        fild:将整数扩展为80位浮点数

        fist,fistp,fisttp:将80位浮点数转为整数

        fbld,fbstp:加载并存储80位BCD数值

        fadd,faddp,fiadd:无操作数指令取栈顶两个浮点数相加存放到栈中,fadd有操作数相加存放到目标寄存器中,faddp有操作数相加然后弹出st(0),内存操作数相加到st(0)中

fadd
faddp

fadd	st(i),st(0)
fadd	st(0),st(i)
faddp	st(i),st(0)

fadd	mem32
fadd	mem64
fiadd	mem32
fiadd	mem64

        fsub,fsubp,fsubr,fisub,fisubr

        fmul,fmulp,fimul

        fdiv,fdivp,fdivr,fdivrp,fidiv,fidivr

        fsqrt:计算栈顶的平方根,栈顶必须为0或正数,否则将生成无效操作异常

        frndint:将栈顶数值舍入为最接近的整数

        fabs:通过清除st(0)尾数符号来计算st(0)的绝对值。如果栈为空,将设置栈异常位和无效操作位

        fchs:反转尾数符号更改st(0)值的符号。如果栈为空,将设置栈异常位和无效操作位。

        fcom,fcomp,fcompp,fcomi,fcomip:与st(0)比较

fcom
fcomp
fcompp

fcom 	st(i)
fcomp 	st(i)

fcom	mem32
fcom	mem64
fcomp	mem32
fcomp	mem64

fcomi	st(0),st(i)
fcomip	st(0),st(i)

        ftst:将st(0)与0.0进行比较

        fldz,fld1,fldpi,fldl2t,fldlg2,fldln2:常量指令

        f2xm1,fsin,fcos,fsincos,fptan,fpatan,fyl2x,fyl2xp1:超越函数指令

        finit,fninit:对fpu初始化,fninit不检查挂起浮点异常。

        fldcw,fstcw:加载储存控制字

        fclex,fnclex:清除fpu状态寄存器中的所有异常位,栈故障位和busy flag位。

        fstsw,fnstsw:将状态寄存器储存到16位内存单元或ax寄存器中

代码

main.cpp

//main.cpp
#include<iostream>

using namespace std;

extern "C"{
    double dadd(double a,double b);
    double dsub(double a,double b);
    double dmul(double a,double b);
    double ddiv(double a,double b);
}

int main(){
    double a=1.1;
    double b=2.2;
    cout<<dadd(a,b)<<endl;
    cout<<dsub(a,b)<<endl;
    cout<<dmul(a,b)<<endl;
    cout<<ddiv(a,b)<<endl;
    return 0;
}

fpu.asm

//fpu.asm
    option casemap:none

    .data 
    a   real8 ?
    b   real8 ?
    
    .code 
    public dadd
dadd proc
    finit
    movsd   a,xmm0
    movsd   b,xmm1
    fld     a
    fld     b
    fadd
    fst     a
    movsd   xmm0,a
    ret
dadd endp

    public dsub
dsub proc
    finit
    movsd   a,xmm0
    movsd   b,xmm1
    fld     a
    fld     b
    fsub
    fst     a
    movsd   xmm0,a
    ret
dsub endp

    public dmul
dmul proc
    finit
    movsd   a,xmm0
    movsd   b,xmm1
    fld     a
    fld     b
    fmul
    fst     a
    movsd   xmm0,a
    ret
dmul endp

    public ddiv
ddiv proc
    finit
    movsd   a,xmm0
    movsd   b,xmm1
    fld     a
    fld     b
    fdiv
    fst     a
    movsd   xmm0,a
    ret
ddiv endp
end

参考

  1. [美]兰德尔·海德.64位汇编语言的编程艺术
  2. Intel® 64 and IA-32 Architectures Software Developer’s Manual Combined Volumes: 1, 2A, 2B, 2C, 2D, 3A, 3B, 3C, 3D, and 4
  3. AMD64 Architecture Programmer’s Manual Volumes 1–5
  • 19
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值