在32位环境下, float占用32位,double占用64位,
目前C/C++编译器标准都遵照IEEE制定的浮点数表示法来进行float,double运算。这种结构是一种科学计数法,用符号、指数和
尾数来表示,底数定为2——即把一个浮点数表示为尾数乘以2的指数次方再添上符号。下面是具体的规格:
符号位 阶码 尾数 长度
float 1 8 23 32
double 1 11 52 64
下面分别举例说明:
将100分别转化为float型和double型的二进制表达。
100=(1+1/2+1/16)*2^6
转为float型为
100为正数,符号位为0,
阶码,一共8位,因为指数可以为负,为了便于计算,规定都先加上127,在这里6+127=133转为二进制为10000101
尾数转为1.1001,因为最高位的1 不写入内存,则尾数转为23位二进制为10010000000000000000000
合在一起就是01000010110010000000000000000000
转为double型为
100为正数,符号位为0,
阶码,一共11位,因为指数可以为负,为了便于计算,规定都先加上1023,在这里6+1023=1029转为二进制为10000000101
尾数转为1.1001,因为最高位的1 不写入内存,则尾数转为52位二进制为1001000000000000000000000000000000000000000000000000
合在一起就是0100000001011001000000000000000000000000000000000000000000000000
将float转为二进制字符串
//str should have at least 33 byte.
void floattostr(float* a, char* str){
unsigned int c;
c= ((unsigned int*)a)[0];
for(int i=0;i<32;i++){
str[31-i]=(char)(c&1)+'0';
c>>=1;
}
str[32] = '\0';
}
将double转为二进制字符串
//str should have at least 64 byte.
void doubletostr(double* a, char* str){
long long c;
c= ((long long*)a)[0];
for(int i=0;i<64;i++){
str[63-i]=(char)(c&1)+'0';
c>>=1;
}
str[64] = '\0';
将32位二进制字符串转为float
float strtofloat(char * str){
unsigned int flt = 0;
for(int i=0;i<31;i++){
flt += (str[i]-'0');
flt <<= 1;
}
dbl += (str[31]-'0');
float * ret = (float*)&flt;
return *ret;
}
将64位二进制字符串转为double
double strtodbl(char * str){
long long dbl = 0;
for(int i=0;i<63;i++){
dbl += (str[i]-'0');
dbl <<= 1;
}
dbl +=(str[63]-'0');
double* db = (double*)&dbl;
return *db;
}