float原理与使用详解

最新推荐文章于 2024-01-21 21:03:46 发布

zcliatb

最新推荐文章于 2024-01-21 21:03:46 发布

阅读量5.5k

点赞数 2

分类专栏：语法文章标签： float详解

本文链接：https://blog.csdn.net/zcliatb/article/details/41078595

版权

语法专栏收录该内容

10 篇文章 0 订阅

订阅专栏

一、概况float 32位数据，8位用于存储指数，24位存储尾数。

基本参数从cfloat,climits（float.h）中查看：

#define FLT_DIG 6

#define FLT_MANT_DIG 24

#define FLT_MAX_10_EXP +38

#define FLT_MIN_10_EXP -38

分别表示，有效数字位数，尾数位数，指数最大，最小值。

二、将一个float型转化为内存存储格式的步骤为：

（1）先将这个实数的绝对值化为二进制格式。

（2）将这个二进制格式实数的小数点左移或右移n位，直到小数点移动到第一个有效数字的右边。

（3）从小数点右边第一位开始数出二十三位数字放入第22到第0位。

（4）如果实数是正的，则在第31位放入“0”，否则放入“1”。

（5）如果n 是左移得到的，说明指数是正的，第30位放入“1”。如果n是右移得到的或n=0，则第30位放入“0”。

（6）如果n是左移得到的，则将n减去1后化为二进制，并在左边加“0”补足七位，放入第29到第23位。如果n是右移得到的或n=0，则将n化为二进制后在左边加“0”补足七位，再各位求反，再放入第29到第23位。

三、将一个内存存储的float二进制格式转化为十进制的步骤：

（1）将第22位到第0位的二进制数写出来，在最左边补一位“1”，得到二十四位有效数字。将小数点点在最左边那个“1”的右边。

（2）取出第29到第23位所表示的值n。当30位是“0”时将n各位求反。当30位是“1”时将n增1。

（3）将小数点左移n位（当30位是“0”时）或右移n位（当30位是“1”时），得到一个二进制表示的实数。

（4）将这个二进制实数化为十进制，并根据第31位是“0”还是“1”加上正号或负号即可。

float存储如下所示： 1位S ，8位E，23位F

其中F= 1.f(22)....f(0)

E= e - Bias(127)

X = F*2^E

四、代码与详细说明：

1. 其中S位占1bit，为bit31看，S位为0代表浮点数是正数，S位为1代表浮点数是负数。

2. E位占8bits，为bit23~bit30。E位代表2的N次方，但需要减去127（移位存储，后面再解释），比如说E位为87，那么E位的值为2（87-127）=9.094947017729282379150390625e-13。

3. F位占23bits，为bit0~bit22。F位是小数点后面的位数，其中bit22是2^-1=0.5，bit21是2^-2=0.25，以此类推，bit0为2^-23=0.00000011920928955078125。但F位里隐藏了一个1，也就是说F位所表示的值是1+（F位bit22~bit0所表示的数值），比如说F位是(0b)10100000000000000000001，只有bit22、bit20和bit0为1，那么F位的值为1+(2^-1+2^-20+2^-22)，为1.5000011920928955。

代码与分析：

#include <iostream>
using namespace std;
int main()
{
	float a = 100;
	cout<<a<<endl;
	unsigned char *b;
	b = (unsigned char *)&a;
	for(unsigned int i=0;i<4;++i){
		cout<<hex<<static_cast<int>(b[i])<<endl;// 检测转换保证安全
	}
	cin.get();
}