Floating-Point Numbers UVA - 11809
在计算计组成原理中也学习了浮点数应该如何使用阶码与尾码存储了,这里就不细讲了,即浮点数
=
M
∗
2
E
=M*2^E
=M∗2E,大概就是给出一个浮点数,让求阶码和尾码的位数,因为说了是最大的浮点数,所以阶码与尾码必然全为1,又指出位数范围,不大,可以打表。
假设当前一层M和E的值为m和e,它们的位数分别为i和j。
首先计算m的值,用二进制表示的话,m的值为0.11…,也就是m = 2^(-1) + 2^(-2) + … + 2^(-1 - i)(i比实际1的个数少1个),也就是m = 1 - 2^(-1 - i)。
接下来就是计算e的值,不难得出,e = 2^j - 1。
可以得出m * 2^e = A * 10^B,我们A和B已经给出了
但因为j最大为30,即e最大为2^30-1,这还只是2的指数,太大了,没办法存储,所以我们可以分别对两边取对数,即log10(m) + e × log10(2) = log10(A) + B。
因为此时m和e的值都是确定的,所以不妨令等式左边为t,也就有t = log10(A) + B。
如果是科学记数法的话,那么对于A,就有1 ≤ A < 10。那么0 < log10(A) < 1。所以t的小数部分就是log10(A),整数部分就是B,即B = ⌊t⌋,A = 10^(t - B)。那么接下来,我们只需要开出两个二维数组来,分别记录对应i和j下A和B的大小,之后从输入里提取出A和B的大小,去二维数组里面查找对应的i和j即可。
#include<bits/stdc++.h>
using namespace std;
char s[1005];
double a,b;
double A[20][40];
long long B[20][40];
void f1(){
for(int i=0;i<=9;i++){
for(int j=1;j<=30;j++){
double m=1-pow(2,-1-i);
double e=pow(2,j)-1;
double t=log10(m)+e*log10(2);
B[i][j]=t;
A[i][j]=pow(10,t-B[i][j]);
}
}
}
void f2(char s[]){
int i,j;
double k=0.1;
a=b=0;
for(i=0;i<strlen(s);i++)
if(s[i]=='e')
break;
for(j=0;s[j]!='.';j++){
a*=10;
a+=s[j]-'0';
}
for(j=j+1;j<i;j++){
a+=(s[j]-'0')*k;
k/=10;
}
for(j=i+1;j<strlen(s);j++){
b*=10;
b+=s[j]-'0';
}
}
int main(){
f1();
while(scanf("%s",s) && strcmp(s,"0e0")!=0){
f2(s);
//cout<<a<<' '<<b<<endl;
while(a<1){
a*=10;
b--;
}
for(int i=0;i<=9;i++){
for(int j=1;j<=30;j++){
if(b==B[i][j]&&(fabs(a - A[i][j]) < 1e-4 || fabs(a / 10 - A[i][j]) < 1e-4)){
printf("%d %d\n",i,j);
break;
}
}
}
}
return 0;
}