1.浮点数在计算机中的存储机制
32bit:bit0~bit22存储有效数字部分;bit23~bit30存储指数部分;bit31存储符号位
64bit:bit0~bit51存储有效数字部分;bit52~bit62存储指数部分;bit63存储符号位
例如:30.25
二进制表示方法:11110.01,转换为二进制指数法:1.111001*2^4
2.使用浮点数可能出现的精度损失
#include
#include
using namespace std;
void main()
{
char buff[100] = { '\0' };
float fa = 500.5;//存储的时候转换为二进制111110100.1,存储有效位的bit是足够的,所以并不会有精度损失
float fb = 500.344;//111110100.0101100000000....后面多少位,懒得算了,存储有效数字部分的bit应该是不够的,所以存储进来会出现精度损失
float fc = 500.125;//111110100.001,和第一种情况一样,bit足够存储有效位,所以不会有精度损失
//当然同理,double类型的数据也会出现以上情况,只是所占字节数不一样罢了
getchar();
}
因此,是否会出现精度损失,与你的数据本身有关系,换句话说,就是小数点后面的部分能不能用有限位数的
来表示,即n是否小于float或者double用于存储有效为的bit数。
3.浮点数比较的方法-epsilon-方法
假定存在两个浮点数A,B,如果直接比较,是非常不明智的,可以令X=A-B,再设定一个小的参考量e=0.0001(结合实际情况设定),然后比较X与e之间的大小。