float->int
当浮点数指数位小于0x7f时
指数位小于1,此时浮点数最大值位0.99999994,转换位整数后为0(Round toward zero舍入模式)。
当浮点数绝对值大于等于2147483648(0x4f000000)
由于int的表示范围是[-2147483648,2147483647],因此统一转换为-2147483648。
除以上两种情况外
以150.15014为例,指数位0x86,0x86 - 0x7f = 7,亦即指数大小为2^7,因此小数位1.5015014需要左移7位,然后舍去剩余的小数部分(Round toward zero),最终可得0b10010110 = 150。
代码
int cvt_float_to_int(float x) {
unsigned int xi = *((unsigned int *)&x);
unsigned int sign = xi & 0x80000000;
unsigned int exponent = (xi & 0x7f800000) >> 23;
unsigned int mantissa = xi & 0x007fffff;
int y;
if (exponent < 0x7f) {
return 0;
}
if ((xi & 0x7fffffff) >= 0x4f000000) {
return 0x80000000;
}
/*在浮点数表示中,当指数位的值不为0时,小数位最高位的1被省略了。因此在这里需要补上(float小数位的长度位23,因此要在第24位补1)*/
mantissa |= 0x00800000;
/*根据指数位的值保留响应的小数位部分*/
if (exponent - 0x7f <= 23) {
y = mantissa >> (23 - (exponent -0x7f));
} else {
y = mantissa << ((exponent -0x7f) - 23);
}
/*int负数以补码形式表示*/
if (sign) {
y = ~y + 1;
}
}
int->float
特殊值
当int值等于0时,对应的浮点数依旧为0;当int值为0x80000000时,转换为浮点数等于-2147483648.0。
其他情况
可以看作是float->int的逆向操作,但需要注意此时的舍入模式位RN,即
1.当舍入部分最高位为0时,可以直接舍去;
2.当舍入部分最高位为1,且其他位不全为0时,舍去的同时还要将保留部分加1进位;
3.当舍入部分最高位是1,且其他位均为0时,若保留部分的末位为0,则直接舍去,若保留部分的末位为1,则需要加1进位。
unsigned int clz(int x) {
for (int i = 0; i < 32; i++) {
if ((x >> i) == 0) {
return 32 - i;
}
}
return 0xffffffff;
}
float cvt_int_to_float(int x) {
unsigned int sign = 0;
unsigned int exponent = 0;
unsigned int mantissa = 0;
unsigned int xabs = 0;
unsigned int clzx = 0;
unsigned int y = 0;
unsigned int carry = 0;
if (x == 0x80000000) {
return -2147483648.0;
}
if (x == 0) {
return 0.0;
}
if (x < 0) {
/*int负数需要取绝对值*/
sign = 0x80000000;
xabs = ~x + 1;
} else {
xabs = x;
}
/*对于大于1.0的浮点数的表示形式为 1.xxxxx * 2 ^ n,因此对于int转换成float,需要记录最高位1的位置*/
clzx = clz(xabs);
/*根据最高位1的位置指定指数位的大小,即 1.xxxxx * 2 ^ n 中的n,对于float,当指数位的值为0x7f时表示指数位2 ^ 0 = 1*/
exponent = 0x7f + (31 - clzx);
if (31 - clzx <= 23) {
mantissa = (xabs & ((1 << (31 - clzx)) - 1)) << (clzx - 8);
} else {
mantissa = (xabs & ((1 << (31 - clzx)) - 1)) >> (8 - clzx);
/*rn舍入模式*/
unsigned int tmp1, tmp2;
tmp1 = xabs & ((1 << (8 - clzx)) - 1);
tmp2 = mantissa & 0x1;
if ((tmp1 > (1 << (7 - clzx))) ||(tmp2 == 1 && tmp1 == (1 << (7 - clzx)))) {
carry = 1;
}
}
y = (sign | (exponent << 23) | mantissa) + carry;
return *((float *)&y);
}