浮点数笔记

最新推荐文章于 2024-07-03 20:18:43 发布

qq_29094249

最新推荐文章于 2024-07-03 20:18:43 发布

阅读量387

点赞数

文章标签： c++

本文链接：https://blog.csdn.net/qq_29094249/article/details/104389606

版权

浮点数

C++中共有3种浮点类型：float、double和long double。其中float一般为32位，double为64位,long double 为64位以上。

float和double的范围和精度

范围
float和double的具体区别为
float：
1bit（符号位） 8bits（指数位） 23bits（尾数位）
double：
1bit（符号位） 11bits（指数位） 52bits（尾数位）
其中指数位决定了他们的指数范围，也就是说：
float的指数是-127~128，即可以表示的数字大小范围是2^-127 到2¹²⁸
同理double为2^-1023 到2¹⁰²⁴ 。
在有符号的前提下，float可以表示-2¹²⁸ 到2¹²⁸ 的数据。
我们可以把任何二进制浮点数都化成如下标准形式:
(+/-)1.f * 2^e
在这里插入图片描述
精度
结论：
float可以保证十进制科学计数法小数点后6位有效精度和第7位的部分精度
double可以保证十进制科学计数法小数点后15位有效精度和第16位的部分精度
浮点数的精度是由尾数来决定的。实际上一个浮点数的数值=(符号)尾数2^指数。
那么具体的精度就要看尾数能表示多少：
float的尾数为23位，也就是能表示2²³ =8388608。也就是最大能表示8.3886082¹²⁸
并且精度最大为8位(只能保证7位最精确)。
double的尾数是52位，2^52 = 4503599627370496，一共16位，精度保证15位精确。

浮点数在计算机中的存储

以float为例：
在这里插入图片描述
根据二进制转为10进制： (+/-)1.f * 2^e
但是此e非彼e----公式中的e要计算偏移。由于指数是从2^-127~2¹²⁸，所以实际上的e应该是存储的偏移量e-127。
修改后为(-1)^s *

最低0.47元/天解锁文章

qq_29094249

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
浮点数笔记

浮点数C++中共有3种浮点类型：float、double和long double。其中float一般为32位，double为64位,long double 为64位以上。float和double的范围和精度范围float和double的具体区别为float：1bit（符号位） 8bits（指数位） 23bits（尾数位）double：1bit（符号位） 11bits（指数位） 52...
复制链接

扫一扫