FPU
FPU提供8个80位的浮点数据寄存器,这些寄存器被组织成一个栈,MASM将这些称为ST(0)······ST(7)。
图1-1 FPU浮点数据寄存器栈
x87 FPU的16位控制字用于控制x87 FPU的精度和舍入方式。它还包含x87 FPU浮点异常掩码位。控制字缓存在x87 FPU控制寄存器中。该寄存器的内容可以用FLDCW指令加载,通过FSTCW / FNSTCW指令加载到内存。
图1-2 FPU控制字
0-5:无效操作,非规范化,零除,向上溢出,向下溢出,精度
8-9:精度控制
10-11:舍入控制
12:无穷控制
其它:保留位
x87 FPU的16位状态寄存器显示x87 FPU的当前状态。flags在x87的FPU状态寄存器包括,FPU busy、栈顶指针、条件码标志、溢出标志、堆栈故障标志和异常标志。x87 FPU在这个寄存器中设置标志来显示操作的结果。
图1-3 FPU状态寄存器
0-7:无效操作,非规范化,零除,向上溢出,向下溢出,精度,栈故障,异常
8,9,10,14:条件码
11-13:栈指针的顶部
15:忙/空闲
FPU数据类型
整数:16位,32位,64位
压缩10进制:18位有符号十进制(BCD)整数
浮点:32位,64位,80位(80为非规范化)
FPU指令集
fld:将浮点数值入栈
fst,fstp:将浮点栈顶复制到另一个浮点寄存器中
fxch:将浮点栈顶与另一个FPU寄存器进行交换
fild:将整数扩展为80位浮点数
fist,fistp,fisttp:将80位浮点数转为整数
fbld,fbstp:加载并存储80位BCD数值
fadd,faddp,fiadd:无操作数指令取栈顶两个浮点数相加存放到栈中,fadd有操作数相加存放到目标寄存器中,faddp有操作数相加然后弹出st(0),内存操作数相加到st(0)中
fadd
faddp
fadd st(i),st(0)
fadd st(0),st(i)
faddp st(i),st(0)
fadd mem32
fadd mem64
fiadd mem32
fiadd mem64
fsub,fsubp,fsubr,fisub,fisubr
fmul,fmulp,fimul
fdiv,fdivp,fdivr,fdivrp,fidiv,fidivr
fsqrt:计算栈顶的平方根,栈顶必须为0或正数,否则将生成无效操作异常
frndint:将栈顶数值舍入为最接近的整数
fabs:通过清除st(0)尾数符号来计算st(0)的绝对值。如果栈为空,将设置栈异常位和无效操作位
fchs:反转尾数符号更改st(0)值的符号。如果栈为空,将设置栈异常位和无效操作位。
fcom,fcomp,fcompp,fcomi,fcomip:与st(0)比较
fcom
fcomp
fcompp
fcom st(i)
fcomp st(i)
fcom mem32
fcom mem64
fcomp mem32
fcomp mem64
fcomi st(0),st(i)
fcomip st(0),st(i)
ftst:将st(0)与0.0进行比较
fldz,fld1,fldpi,fldl2t,fldlg2,fldln2:常量指令
f2xm1,fsin,fcos,fsincos,fptan,fpatan,fyl2x,fyl2xp1:超越函数指令
finit,fninit:对fpu初始化,fninit不检查挂起浮点异常。
fldcw,fstcw:加载储存控制字
fclex,fnclex:清除fpu状态寄存器中的所有异常位,栈故障位和busy flag位。
fstsw,fnstsw:将状态寄存器储存到16位内存单元或ax寄存器中
代码
main.cpp
//main.cpp
#include<iostream>
using namespace std;
extern "C"{
double dadd(double a,double b);
double dsub(double a,double b);
double dmul(double a,double b);
double ddiv(double a,double b);
}
int main(){
double a=1.1;
double b=2.2;
cout<<dadd(a,b)<<endl;
cout<<dsub(a,b)<<endl;
cout<<dmul(a,b)<<endl;
cout<<ddiv(a,b)<<endl;
return 0;
}
fpu.asm
//fpu.asm
option casemap:none
.data
a real8 ?
b real8 ?
.code
public dadd
dadd proc
finit
movsd a,xmm0
movsd b,xmm1
fld a
fld b
fadd
fst a
movsd xmm0,a
ret
dadd endp
public dsub
dsub proc
finit
movsd a,xmm0
movsd b,xmm1
fld a
fld b
fsub
fst a
movsd xmm0,a
ret
dsub endp
public dmul
dmul proc
finit
movsd a,xmm0
movsd b,xmm1
fld a
fld b
fmul
fst a
movsd xmm0,a
ret
dmul endp
public ddiv
ddiv proc
finit
movsd a,xmm0
movsd b,xmm1
fld a
fld b
fdiv
fst a
movsd xmm0,a
ret
ddiv endp
end
参考
- [美]兰德尔·海德.64位汇编语言的编程艺术
- Intel® 64 and IA-32 Architectures Software Developer’s Manual Combined Volumes: 1, 2A, 2B, 2C, 2D, 3A, 3B, 3C, 3D, and 4
-
AMD64 Architecture Programmer’s Manual Volumes 1–5